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内 容 提 要 
本 书 侧重 生产 环境 下 的 Erlang 开发 ， 主 要 讲解 如 何 构建 稳定 、 版 本 控制 展 好 、 可 维护 的 产品 级 代码 ， 
凝聚 了 三 位 Erlang 大 师 多 年 的 实战 经 验 。 
本 书 主 要 分 为 三 大 部 分 : 第 一 部 分 讲解 Erlang 编程 及 OTP 基础 ; 第 二 部 分 讲解 如 何在 实际 开发 中 逐 
一 添加 OTP 高 级 特性 ， 从 而 完善 应 用 ， 作 者 通过 贯穿 本 书 的 主 项 目 一 一 加 速 Web 访问 的 分 布 式 缓存 应 用 ， 
座 入 浅 出 地 冰 明 了 实践 中 的 各 种 技巧 ; 第 三 部 分 讨论 如 何 将 代码 与 其 他 系统 和 用 户 集成 ， 以 及 如 何 进 行 性 
能 调 优 。 
本 书面 向 Erlang 程序 员 ， 以 及 对 Erlang/OTP 感 兴 趣 的 开发 人 员 。 
图 灵 程 序 设计 从 书 
Erlang/OTP 并 发 编程 实战 


9S 车 [ 美 ] Martin Logan [ 美 ] Eric Merritt 
[ 玉 典 ] Richard Carlsson 
详 连 城 
贡 任 编辑 ” 毛 信 傅 
执行 编辑 刘 美 英 
$$ 人 民 邮 电 出 版 社 出 版 发 行 ”北京 市 崇文 区 夕照 地 街 14 号 
邮编 ”100061 电子 邮件 ”315@ptpress.com.cn 
网 址 ”http://www.ptpress.com.cn 











北京 印刷 
仿 开本 : 800X1000 1/16 
印张 : 22.25 
字数 :526 千 字 2012 年 7 月 第 1 版 
印 数 : 1 一 4 000 册 2012 年 7 月 北京 第 1 次 印刷 


著作 权 合 同 登 记号 ”图 字 : 01-2011-0610 号 
ISBN 978-7-115-28559-1 
定价 : 79.00 元 
读者 服务 热线 : (010)51095186 转 604” 印 装 质量 热线 : (010)67129223 
反 盗 版 热线 : (010)67171154 


图 灵 社 区 会 员 for(;;)(13433955876@163.com) 专 享 尊重 版 权 


版 权 声 明 


Original English janguage edition, entitled Erlang and OTP in Action by Martin Logan, Eric Merritt, 
Richard Carlsson, published by Manning Publications, 178 South Hill Drive, Westampton, NJ 08060 
USA. Copyright © 2011 by Manning Publications. 

Simplified Chinese-language edition copyright © 2012 by Posts & Telecom Press. All rights reserved. 





本 书 中 文 简体 字 版 由 Manning Publications 授 权 人 民 邮 电 出 版 社 独家 出 版 。 未 经 出 版 者 书面 许 
可 ， 不 得 以 任何 方式 复制 或 抄 欠 本 书 内 容 。 
版 权 所 有 ， 侵 权 必 究 。 








图 灵 社 区 会 员 for(;;)(13433955876@163.com) 专 享 尊重 版 权 


译 者 序 





本 科 毕 业 后 , 我 的 第 一 份 工作 是 即时 通信 服务 研发。 大 约 在 2007 年 年 底 的 时 候 ， 出 于 工作 原 
， 我 对 XMPP 产 生 了 兴趣 。 在 调研 过 程 中 , 我 找 来 了 各 种 XMPP 服 务 硕 进行 比较 。 令 我 居 诈 的 
是 ， 业 内 公认 最 为 优秀 的 分 布 式 XMPP 服 务 器 ejabberd， 竞 然 是 用 一 种 样 貌 诡异 的 冷 储 语 言 写成 
的 这 便 是 我 与 Erlang 的 第 一 次 碰面 。 相 较 于 日 党 惯用 的 C++ 和 Java，Erlang 对 我 来 说 既 阳 生 又 
怪异 。 团 轿 否 束 地 过 了 一 裔 相关 资料 之 后 , 我 惊讶 地 发 现 这 门 语言 荡然 已 有 近 三 十 年 的 历史 ,而 
日 功 能 完备 、 羽 婆 丰 满 。 然 而， 星 深 的 语法 和 文档 却 令 我 举 头 转 癌 ， 加 上 初 识 函 数 式 语言 ， 思 维 
方式 一 时 难以 转变 ， 这 第 一 次 亲密 接触 没 过 多 久 便 宣告 结束 。 

一 年 多 之 后 ，Facebook 发 布 了 基于 XMPP 的 即时 通信 服务 Facebook Chat， 所 用 的 服务 需 正 是 
经 过 定制 的 ejabberd”。 刚 好 那 段 时 间 正 在 琢磨 分 布 式 一 致 性 相关 的 问题 ， 迫 切 需 要 一 门 便于 实 
现 分 布 式 算法 的 语言 。 于 是 我 开始 在 官方 文档 和 Concurrent Programming in Erlang 的 指引 下 学 习 
Erlang。 很 快 我 便 发 现 ， 只 要 适应 了 尾 递 归 和 单 次 赋值 等 图 数 式 编程 的 特点 ，Erlang 语 言 本 刁 非 
党 地 简单 明了 。 经 过 初步 的 摸索 ， 对 Erlang 的 认识 也 逐渐 完整 起 来 。 最 初 以 为 这 是 一 门 阳春 白雪 
的 学 院 铂 语言 ， 后 来 却 发 现 大 错 特 错 。 目 打 诞 生 之 日 起 ，Erlang 就 是 一 门 目的 性 和 工程 性 极 强 的 
语言 。 它 的 特性 集合 历经 电信 行业 的 千 锤 百 炼 ， 几 乎 不 市 一 丝 一 晶 的 水 分 。 尤 为 有 趣 的 是 ， 正 如 
本 书 答 介 中 所 述 ，Erlang 的 历史 与 工程 型 语言 的 另 一 典范 C 怀 人 地 相似 。 但 是 ， 由 于 思想 过 于 前 
卫 , 这 门 优秀 的 声言 却 一 下 未 能 受到 足够 的 关注 。 在 服务 大 端的 开发 者 们 都 在 兴致 勃勃 地 探讨 如 
何 通过 避免 内 存 复制 来 提高 单机 性 能 时 ,复制 式 消息 传递 简直 惑 是 异端 收 说 ! 过 去 十 年 间 ， 并 发 
处 理 的 复杂 性 已 经 随 春 硬件 瓶 肛 的 到 来 而 凸显 出 来 。 然 而 ， 对 于 一 线 应 用 的 开发 者 而 言 ， 近 年 来 
大 规模 互联 网 应 用 的 炮 炸 式 增长 才 切 实 将 并 发 处 理 变 成 了 一 个 吸 竺 解决 的 现实 问题 。 

没 想到 很 快 冷水 便 臂 头 盖 脸 地 浇 了 下 来 一 一 Erlang 的 并 发 、 容 错 机 制 只 是 整个 体系 的 基石 ， 
要 想 真 正 发 挥 出 它们 的 威力 ， 还 要 仰 仗 一 套 叫做 OTP 的 东西 。 这 玩意 儿 可 真是 折腾 死人 了 ! OTP 
行为 模式 迷宫 般 的 回调 逻辑 把 我 绕 得 坚 头 转 回 ; 在 解决 具体 问题 时 ,我 总 是 搞 不 清楚 到 底 该 用 
gen_server、gen_fsm 还 是 gen_event; 好 不 容易 在 Erlang shell 里 跑 通 一 段 代 码 ， 想 打包 部 署 
到 其 他 机 需 上 做 多 机 实验 时 又 撞 了 一 头 包 : 应 用 、 发 布 镜像 、 变 幻 真 测 的 配置 项 、 漫 天 飞 狂 的 版 
本 号 、 语 胡 不 详 的 官方 文档 :…… 所 有 这 些 秦 鬼 般 的 细 市 无 不 泰 食 着 我 所 剩 不 多 的 耐心 。 

译 完 本 书 之 后 再 回 过 头 来 看 ， 其 实 OTP 的 核心 概念 并 不 复杂 ， 当 年 最 让 我 搓 火 儿 的 还 是 实战 











































































































GD 参见 http://blog.process-one.net/facebook chat supports xmpp with ejabberd/。 
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译 者 序 V 


过 程 中 各 种 剪 不 断 理 还 乱 的 繁琐 细节 。Erlang/OTP 的 官方 文档 并 不 缺 细 节 , 但 这 些 细 市 却 水 银 演 
地 般 地 散落 在 各 个 角落 里 , 缺乏 一 条 将 它们 有 机 地 贯穿 起 来 的 主线 。 梳理 这 一 主线 ， 正 是 本 书 的 
任务 。 全书 以 交付 产品 级 代码 为 目标 ， 以 一 个 现实 而 鲜 活 的 虚拟 项 目 为 舞台 , 深入 浅 出 地 讲解 了 
OTP 中 最 为 重要 的 机 制 和 概念 ， 并 清晰 地 呈现 了 它们 之 则 的 内 在 联系 。 如 采 说 Erlang/OTP 的 官方 
文档 是 个 繁华 的 大 都 市 ,那么 这 本 书 就 是 一 本 地 图 ,明白 了 关键 机 制 和 概念 之 间 的 内 在 联系 之 后 ， 
按 图 有 索 允 深 入 学 习 Erlang /OTP 就 不 再 是 什么 难事 了 。 

既然 是 译 者 序 ， 那 么 再 说 说 译 书 的 那些 事 儿 吧 。2009 年 至 2010 年 间 ， 我 在 Erlang China 社 区 
内 发 起 了 CPiE-CN 项 目 ， 召 集 了 一 批 志愿 译 者 共同 完成 了 Concurrent Programming in Erlang (Part 
刀 中 文 版 《Erlang 并 发 编程 (第 一 部 分 )》 的 翻译 。 后 来 , 正 是 这 一 项 目 促 使 我 成 为 了 本 书 的 译 者 。 
在 此 我 要 对 CPiE-CN 的 儿 位 志愿 译 者 表示 感谢 ， 他 们 是 王 飞 、 赵 衬 坤 、 张 驰 原 、 丁 察 、 赵 卫 国 和 
天 上 峻 。 在 本 书 近 一 年 的 翻 详 过 程 中 ,我 要 感谢 图 灵 教 育 的 傅 志 红 老 师 、 李 松 峰 老师 和 刘 关 英 老 师 
的 帮助 ， 感 谢 他 们 容 好 了 我 非常 规 的 交 稿 方式 (以 及 蜗 牛 般 的 进度 )。 我 还 要 感谢 几 位 协助 校对 
部 分 中 间 译 稳 的 早期 读者 ,他们 是 赵 卫 国 、 田 中 博 和 倪 华 杰 。 最 后 ,特别 感谢 我 的 妻子 雅 利 : 这 
一 年 中 ,本 职工 作 的 繁重 程度 远 远 超出 了 我 的 想象 , 所 剩 不 多 的 业余 时 间 完 全 被 这 本 书 消耗 列 尺 ， 
如 果 没 有 她 的 文 持 和 监督 ， 里 为 重度 拖延 症 患者 的 我 也 许 根 本 就 坚持 不 下 来 。 

好 啦 ， 朵 话 少 说 ， 预 祝 各 位 谈 者 在 旦 用 本 书 的 过 程 中 玩 儿 得 开心 ! 
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友 


长 久 以 来 ,， Erlang 界 仅 有 一 本 书 流传 于 世 , 即 1993 年 出 版 、1996 年 修订 的 “ 红 宝 书 ”"。 花 上 100 
多 美元 Erlang 的 拥 刍 现在 还 能 购 习 到 这 本 书 的 印刷 版 。“ 红 宝 书 ”出 版 已 人 靖 十 年 ， 书 中 的 内 容 早 已 
过 时 。 这 门 语言 几经 演变 ， 又 新 增 了 一 些 强 有 力 的 编程 结构 。 广 泛 应 用 于 现代 Erlang 程 序 的 高 阶 哨 
数 、 列 表 速 构 (list comprehension ) “和 比特 位 语法 ( bit syntaz ) 等 ,“ 红 宝 书 ”都 未 曾 收 录 。 不 过 ， 
发 布 于 1996 年 的 Erlang 应 用 开发 框架 一 一 开放 电信 平台 ( OTP，Open Telecom Platform ) 一 一 才 是 全 
书 空缺 内 容 中 最 关键 的 一 环 。Erlang 并 不 难 学 , OTP 却 恰恰 相反 。 像 本 书 作 者 Martin Logan 这 种 自 1999 
年 便 开 始 接触 Erlang 的 早期 用 户 ， 基 本 上 只 能 靠 不 断 试 错 硬 磁 便 地 学 习 OTP。 

在 过 去 的 几 年 中 ， 大 量 Erlang 相 关 图 书 不 断 出 版 ， 足 以 证 明 语 言 本 时 的 魅力 。 我 们 曾 获 悉 还 
有 几 本 新 书 即 将 问世 ， 其 中 最 受 瞩 目的 便 是 Martin Logan、Eric Merritt 和 Richard Carlsson 合 车 的 
这 本 书 。 如 今 它 终于 面世 了 。 

我 是 从 1993 年 开始 接触 Erlang 编 程 的 ， 那 时 我 正在 阿拉 斯 加 的 安 克 雷 奇 设计 灾难 应 急 系统 。 
我 购买 了 一 套 随 QIC 磁 市 发 布 的 HP-UX 预 编译 厂 Erlang。 当 时 的 Erlang 规 模 比 现在 小 , 支持 库 的 数 
量 也 少 。 我 不 得 不 目 行 设计 数据 访问 结构 、 数 据 库 管理 硕 、 协 议 解析 融 以 及 错误 处 理 框 织 一 一 不 
过 我 却 醉心 于 此 。 那 时 候 跟 现在 可 没 法 比 : 随 大 同一 年 Mosaic 浏 览 右 的 发 布 Web 才 刚刚 兴起 ， 口 
0 的 概念 也 还 得 再 过 五 年 才 会 为 人 所 知 。 在 这 样 的 背景 下 , 要 想 获 取 一 僚 支 持 分 布 式 计算 和 容错 
的 编程 框架 ,就 只 能 儿 狠 地 克 钱 友 时 间 。 我 淘 沉 了 市 面 上 所 有 的 相关 工具 ,上 自 认 已 经 对 各 种 商业 
方案 了 如 指 擎 。 当 时 的 Erlang 既 生 涩 又 不 起 眼 ， 语 法 怪异 、 文 档 奇 缺 ， 但 相 较 于 其 他 工具 ， 其 核 
心理 念 却 显得 更 为 徘 谱 。 

三 年 后 ， 我 已 身 处 珊 典 ， 就 职 于 爱立信 并 担任 史上 最 大 的 Erlang 项 目的 首席 设计 师 。 我 们 正 
打算 用 Erlang 构 建 传说 中 的 口 口 口 ATM 交 换 系 统 ， 以 及 一 套 名 为 开放 电信 平台 的 全 新 框 染 。 之 所 
以 采用 这 个 名 字 ， 主要 是 为 了 迎合 公司 老大 们 的 胃口 一 一 0 0 是 我 们 的 核心 业务 ; 0 0 是 时 下 的 
流行 词 儿 ; 主流 观点 又 认为 要 想 构 建 一 套 健壮 的 复杂 系统 ,你 就 必须 拥有 一 套用 于 解决 见 余 、 远 
程 配 置 支持 、 在 线 软 件 升级 以 及 实时 追踪 调试 等 问题 的 平台 。 



























































GD Joe Armstrong 、Robert Virding 、Claes Wikstr5om 和 Mike Williams 编 写 的 Concurrent Programming in Erlang ( Prentice 
Hall, 1993, 1996 )。( 男 一 本 Erlang 经 上 典 图 书 是 Joe Armstrong 编 写 的 Proeramming Eapzg， 人 称 “Erlang 圣 经 "” ， 中 文 
版 《Erlang 程 序 设计 》 已 经 由 人 民 邮 电 出 版 社 出 版 。 译 者 注 

@) 速 构 ( comprehension ) 这 一 概念 源 自 ZF 集合 论 中 的 ZF 速 构 ， 同 时 也 是 函数 式 编程 语言 中 的 一 种 常见 语法 结构 。 
Erlang 中 的 速 构 是 一 种 在 现 有 列表 /位 串 上 应 用 春 干 约束 条 件 后 重新 构造 新 的 列表 /位 串 的 方法 。 一 一 详 者 注 
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开发 工具 销售 并 非 爱 立信 的 正业 , 但 早 在 20 世 纪 70 年 代 早 期 , 这 儿 就 开始 设计 一 些 用 于 满足 
特定 需求 的 编程 语言 。 值 得 称道 的 是 ， 爱 立信 于 1998 年 开源 了 Erlang/OTP ( 当然 也 有 出 于 自身 利 
益 的 考虑 )。 于 是 全 世界 的 爱好 者 得 以 投 映 其 中 。 起 初 主要 用 于 电信 业 ， 后 来 又 逐步 渗入 到 了 其 
他 领域 。90 年 代 的 时 候 ， 我 们 曾 试 着 向 Web 开 发 者 们 大 力 推 荐 Erlang， 但 那 时 的 Web 开 发 者 所 面 
临 的 挑战 并 非 宛 余 、 可 伸缩 、 高 啊 应 度 的 电子 商务 站 点 的 构建 ; 这 类 系统 的 时 代 疝 未 来 临 ， 并 发 
也 尚未 入 得 主流 程序 员 的 法 有 眼 。 那 时 , 并 发 是 众所周知 的 难点 , 是 人 人 都 唯 就 避 之 而 不 及 的 东西 。 
既然 如 此 ， 人 们 又 何 兰 选用 一 种 连 写 “hello world” 都 得 牵扯 上 并 发 的 语言 呢 ? 

随 着 Web 的 爆炸 式 增长 和 交互 性 渐 强 的 Web 应 用 的 涌现 ， 冷 宫 中 的 Erlang 终 于 被 解救 出 来 。 
物理 定律 也 出 人 意料 地 回 我 们 伸 出 援手 一 一 通过 提高 CPU 时 钟 频率 来 制造 更 快 的 单 核 忌 片 的 技 
术 终 于 达到 了 极限 。 硬 件 制 造 商 们 打出 “免费 午餐 已 经 结束 ”的 口号 ， 促 使 开发 者 放弃 对 高 速 单 
核 处 理 融 的 依赖 ， 转 而 探索 如 何 让 程序 扩展 到 多 个 较 弱 的 核 上 。 这 对 Erlang 来 说 是 绝 佳 的 机 遇 。 
这 意味 着 程序 员 中 的 许多 佼佼 者 至 少 会 开始 注意 Erlang， 并 去 思考 是 什么 令 它 如 此 特别 。 大 部 分 
人 只 会 也 上 一 上 腿 ， 另 一 些 人 则 会 用 目 己 康 悉 的 语言 去 模拟 Erlang 的 理念 。 这 是 件 好 事 ， 它 意味 大 
知晓 并 钟爱 Erlang 及 其 背后 原理 的 人 将 更 受 市 场 的 青睐 。 

目前 OTP 已 经 在 电信 以 外 的 几 个 领域 得 到 验证 ， 那 些 学 习 并 掌握 了 它 的 人 无 不 对 它 赞 不 绝 
口 。Erlang/OTP 是 一 个 非常 强大 的 平台 ， 但 需要 花 时 间 来 学 习 。 在 全 新 项 目 中 应 用 它 时 就 更 是 如 
此 。 有 意思 的 是 ,往往 那些 在 OTP 项 目 中 摸 爬 滚 打 多 年 的 程序 员 ， 也 不 清楚 该 如 何 从 头 构 建 一 个 
基于 OTP 的 系统 。 这 是 因为 应 用 开发 者 只 需 接 触 整个 框架 的 一 小 部 分 。 这 恰恰 是 我 们 在 大 型 项 目 
中 追求 的 目标 ; 但 小 型 初创 公司 的 老板 不 能 指望 会 有 人 挑灯 夜战 ,逐个 儿 搞 定 OTP 发 布 处 理 的 细 
雁 问 题 和 其 他 特 角 和 华 负 里 的 各 种 头疼 事 儿 ， 所 以 必须 有 一 套 行 之 有 效 的 示例 和 教程 。 

我 们 正人 迫切 需 要 一 本 关于 OTP 的 好 书 ， 而 本 书 的 出 现 正 填 补 了 这 一 空白 。Martin Logan 、Eric 
Merritt 和 Richard Carlsson 都 拥有 大 量 Erlang 实 践 经 验 , 而 且 都 为 Erlang 社 区 作出 过 杰出 的 贡献 , 合 
闭 本 书 可 谓 “ 强 强 联 合 "。 我 相信 此 书 定 会 加 速 推 动 Erlang 实 用 化 的 热潮 。 

尺 请 赏析 ! 






























































UL Wiger 
Erlang Solution 有 限 责任 公司 CTO 
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本 书 试图 提 烁 出 成 就 一 名 专业 Erlang 程 序 员 所 和 需 的 最 关键 的 知识 , 借 此 我 们 才能 让 这 门 高 效 
的 语言 发 挥 出 其 最 大 的 潜力 。Erlang/OTP 功 能 强大 , 但 直到 日 前 为 止 ， 对 初学 者 来 说 ， 通 过 人 研 
谈 OTP 文 档 来 自学 OTP 框 架 仍 然 是 件 令 人 望 而 生 旦 的 事情 (这些 文档 探究 了 很 多 细节 ， 却 缺乏 
全 局 观 )。 

本 书 三 位 作者 长 期 从 事 Erlang 相 关 工作 ， 但 各 目的 发 展 轨 迹 却 很 不 一 样 。 

Martin: “我 是 在 目 己 第 一 份 “ 真 正 ” 的 工作 中 接触 到 Erlang 的 。 此 前 我 一 直 从 事 C 和 C++ 开 
发 ， 也 有 意思 得 很 。 我 的 第 一 任 老板 Hal Snyder 甚 至 在 20 世 纪 90 年 代 便 对 多 线程 深恶痛绝 ， 后 来 
迁 逅 了 Erlang。 我 那 时 还 只 是 个 实习 生 , 于 是 他 给 了 我 一 个 要 用 Erlang 完 成 的 项 目 。 原 因 咏 ， 咖 ， 
无 非 是 我 的 工钱 低 ， 即 便 我 摘 古 了 ， 公 司 在 这 柱 买 卖 上 的 损失 也 就 不 过 70 美 元 。 最 后 我 并 没 搞 
古 ， 我 目 己 写 了 一 个 1000 行 的 监督 进程 ， 代 人 码 不 好 看 ， 因 为 那 时 候 我 压根 儿 不 知道 OTP 是 什么 
东西 ， 手 边 当 然 也 不 会 有 相关 的 书 。 在 这 个 过 程 中 ， 我 受 上 了 这 种 “ 靠 谱 ” 的 开发 后 端 系统 的 
方法 ， 也 爱 上 了 Erlang。Erlang 给 了 我 洞悉 未 来 的 机 会 : 我 所 写 的 复杂 分 布 式 系统 ， 所 用 的 高 级 
算法 ， 都 是 我 那些 使 唤 着 命令 式 语 言 的 同事 们 所 梦 霖 以 求 的 ， 不 花 上 两 年 工夫 码 上 一 百 万 行 代 
但 他 们 压根 儿 实 现 不 出 来 。 谈 了 数 千 页 文档 ， 写 了 数 万 行 代 但 之 后 ， 我 依然 钟情 于 它 。 一 路 走 
来 ， 我 遇 到 了 许多 杰出 的 人 物 ， 能 与 其 中 的 两 位 共同 搜 写 本 书 令 我 激动 不 已 。2004 年 我 在 ACM 
会 议 上 发 言 时 遇 到 了 Richard, 四 年 后 我 又 遇 到 了 Eric, 并 和 他 一 同 创建 了 Erlware 一 一 一 个 仍 在 入 
动 发 展 中 的 项 目 。 多 年 来 ，Erlang 在 我 的 职业 生涯 和 个 人 生活 中 一 和 直 扮 演 者 重要 的 角色 ,今后 也 
仍 会 如 此 。” 

Eric:“ 我 全 究 Erlang 完 全 是 无 心 插 柳 。 我 曾 想 写 一 蒜 大 规模 多 人 游戏 。 然 而 我 明白 ， 仪 赁 一 
人 之 力 ， 即便 是 才华 模 洲 ,也 二 不 完 折 有 图 形 处 理 的 活 儿 。 于 是 我 决定 集中 精力 主攻 游戏 逻辑 章 
分 ,觉得 借助 于 合适 的 工具 和 语言 我 应 该 能 解决 这 部 分 问题 。 在 我 的 设计 中 ,我 言 欢 在 游戏 中 设 
立 多 个 代理 对 和 象 , 每 个 代理 对 象 都 能 随时 间 目 主 学 习 并 独立 而 并 发 地 行动 。 那 时 我 能 想到 的 唯一 
可 行 的 办 法 ,就 是 把 每 个 代理 对 象 都 建 模 为 某 种 并 发 的 东西 ,但 当时 我 还 不 知道 这 个 东西 是 什么 。 
我 所 营 握 的 语言 没 法 让 一 个 开发 者 单枪匹马 拿 下 这 么 一 亚 游戏 。 于 是 ,我 开始 考察 各 种 语言 ， 前 
前 后 后 一 共 花 了 大 概 五 年 时 间 ， 作 了 一 些 深 入 的 研究。 我 很 早 就 见识 过 Erlang， 虽 然 很 喜欢 它 的 
并 发 特性 , 但 实在 受 不 了 它 的 语法 和 隆 数 式 特质 。 下 到 考 绎 了 很 多 编程 语言 之 后 ,我 才 香 新 开 妈 
欣 沉 Erlang 并 用 它 编 写 代码 。 那 蒜 游 戏 我 一 卫 也 没 能 写成 ， 但 我 确信 选择 Erlang 没 有 错 ， 经 过 深 
入 的 研究 和 齐 析 , 我 发 现 这 门 霹 言 在 许多 方面 都 大 有 用 武之 地 。 这 大 概 是 2000 年 或 2001 年 的 事情 
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了 。 后 续 几 年 间 , 我 又 自学 了 OTP。 后来， 在 2005 的 时 候 ， 我 在 Amazon.com3 引 和 信 了 了 Erlang， 发 布 
了 Sinan 的 第 一 版 , 还 认识 了 Martin Logan, 并 和 他 一 起 创办 了 Erlware。2008 年 , 我 搬 到 了 芝加哥 ， 
开始 写 书 并 尽心 打 理 Erlware 项 目 。 

Richard: “我 大 概 是 在 1995 年 前 后 接触 Erlang 的 ， 那 时 我 正在 马 普 院 拉 大 学 为 计算 机 科学 硕 
土 论文 选 题 。 这 引导 我 后 来 成 为 高 性 能 Erlang 人 研究 组 的 一 名 博士 研究 生 ， 就 Erlang 编 译 副 和 运行 
时 系统 做 了 寿 干 年 的 研究 。 我 在 瑞典 和 美国 的 会 议 上 结识 了 Martin Logan 和 Eric Merritt， 他 们 对 
Erlang 的 热情 令 我 印象 深刻 ， 尺 管 那 时 候 Erlang 还 是 一 门 鲜 为 人 知 的 语言 一 一 尤其 是 在 美国 。 在 
攻读 博士 学 位 期 间 ， 我 搞 了 几 个 业余 项 目 ， 其 中 语法 工具 库 和 EDoc 应 用 都 源 上 自我 在 编译 天 方面 
的 研究 成 末 ， 而 EUnit 原 本 是 为 了 检查 我 的 学 生 们 的 并 发 编程 作业 是 否 符合 规范 而 设计 的 。 走 出 
学 术 界 之 后 ， 我 做 了 几 年 和 和 Erlang 无 天 的 工作 ， 基 本 上 都 是 在 用 Python、Ruby 和 C++ 写 程序 。 不 
过 最 近 ， 我 加 盟 了 瑞典 最 成 功 的 一 家 创业 公司 ， 再 次 全 职 投 入 Erlang， 目 前 正 投身 于 高 速 发 展 的 
高 可 用 性 文 付 系统 领域 。 

我 们 三 人 努力 从 共同 的 经 验 中 提炼 出 尽 可 能 多 的 内 容 ， 以 便 计 你 在 迈 加 大 师 级 Erlang 程 序 员 
的 道路 上 少 走 弯 路 ; 我 们 也 和 希望 能 借助 本 书 ， 最 终 让 OTP 框 架 成 为 每 个 Erlang 程 序 员 一 一 而 不 是 
少数 能 将 手册 翻 烂 的 人 一 一 都 能 掌握 的 东西 。 
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我 们 首先 要 感谢 的 是 这 个 项 目的 牵头 人 Bob Calco， 没 有 你 就 不 会 有 这 本 书 ， 我 们 和 希望 这 本 
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天 于 本 书 


本 书 主要 讲解 如 何 开 发 真实 、 稳 定 、 版 本 组 织 合 理 且 可 维护 的 软件 。 其 中 理论 讲 得 不 多 ,更 
侧重 于 实战 。 我 们 几 个 人 ( 指 本 书 三 位 作者 ) 都 具有 多 年 的 系统 开发 经 验 ， 本 书 就 是 以 实际 的 应 
用 软件 开发 为 目标 ， 对 这 些 经 验 进 行 提 烁 的 结晶 。Erlang 编 程 语言 本 里 并 非 我 们 的 重点 一 一 市 面 
上 更 适合 用 作 语 言 教程 的 书 有 的 是 ， 本 书 讲述 的 是 生产 环境 下 的 Erlang 开 发 实践 。 

本 书 的 目标 是 提升 独立 程序 员 或 公司 中 的 程序 员 团 队 的 开发 效率 ， 因 此 其 内 容 不 仪 涵盖 了 
Erlang 语 言 本 和 后 ， 更 从 涉 讲解 了 了 Erlang/OTP。Erlang 自 丑 具备 构建 强大 应 用 的 潜能 ， 但 只 有 借助 
OTP 才 能 将 这 种 洪 能 发 挥 出 来 。OTP 既 是 一 个 框架 ， 又 是 一 组 库 ， 更 是 一 套 构建 应 用 的 方法 学 ; 
它 本 质 上 是 对 语言 的 扩展 。 要 正经 学 习 Erlang， 就 一 定 要 学 习 Erlang/OTP。 

本 书 通过 精心 挑选 的 实例 前 明了 如 何在 实践 中 运用 Erlang/OTP。 通 过 杀手 实现 这 些 实例 ， 
你 将 了 解 如 何 构 建 稳固 、 版 本 组 织 合理 的 产品 级 代码 ， 并 以 此 榨 干 机 架 上 32 核 机 器 的 每 个 时 钟 
周期 ! 


本 书 结构 


本 书 分 为 三 部 分 。 第 一 部 分 的 目的 是 融 你 过 一 人 裔 纯 Erlang 编 程 , 并 介绍 一 些 OTP 的 基础 知识 。 

口 第 1 章 介 绍 了 Erlang/OTP 平 台 及 其 主要 特性 ， 例 如 进程 、 消 息 传 递 、 链 接 、 分 布 式 以 及 运 
行 时 系统 。 

口 第 2 前 是 Erlang 编 程 语言 的 一 个 简单 教程 ,是 每 个 专业 Erlang 程 序 员 都 应 了 解 的 内 容 的 参考 
和 总 结 。 

口 第 3 章 将 带 你 开发 一 个 通过 TCP 套 接 字 通信 的 Erlang 服 务 器 ， 借 此 介绍 OTP 行 为 模式 的 
概念 。 

口 第 4 章 介 绍 了 OTP 应 用 和 监督 树 ， 展 示 了 如 何 给 第 3 草 开 发 的 服务 硕 配 上 监督 进程 ， 并 用 
EDoc 生 成 文档 ， 再 一 并 打包 成 应 用 。 

口 第 5$ 章 展示 了 用 于 检测 Erlang 运 行 时 系统 的 主要 GUI 工具 : 应 用 监视 希 、 进 程 管理 需 、 调 
试 顶 和 表 碍 看 大。 

































































@) Erlang/OTP 中 的 “行为 模式 ”( behaviour ) 相当 于 一 类 通用 的 模式 框架 , 用 户 通过 添加 自 定 义 回 调 便 能 够 方便 地 实 
现 相应 的 模式 ， 详 情 请 参见 3.1.2 方 。 译 者 注 
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XII 关于 本 书 


第 二 部 分 讨论 实际 开发 相关 的 问题 , 我 们 将 面 对 一 些 实际 的 开发 任务 , 并 逐渐 向 代码 中 添加 
各 种 更 高 级 的 OTP 特 性 。 

口 第 6 章 将 齐 你 局 动 本 书 的 主 项 目 : 一 套用 于 提升 Web 服 务 器 访问 速度 的 绥 存 系统 。 本 草 展 

示 一 个 更 为 复杂 的 多 进程 应 用 ， 还 介绍 了 将 监督 进程 用 作 进 程 工厂 的 方法 。 

口 第 7 章 曾 述 了 Erlang/OTP 的 日 志和 事件 处 理 机 制 ， 并 介绍 了 如 何 通 过 自 定义 事件 处 理 程序 
的 方式 为 缓存 系统 添加 日 志 功 能 。 

口 第 8 章 介 绍 了 分 布 式 Erlang/OTP， 解 释 了 什么 是 节点 ，Erlang 集 群 如 何 工作 ， 节 点 间 如 何 
通信 ， 以 及 如 何 借助 Erlang shell 的 任务 控制 功能 在 远程 节点 上 执行 操作 。 紧 接 肴 我 们 将 
运用 所 学 知识 来 实现 一 个 分 布 式 资源 发 现 应 用 ， 用 以 发 布 和 查询 Erlang 贡 点 集群 中 的 可 
用 资源 信息 。 

口 第 9 章 将 介绍 Erlang 内 置 的 Mnesia 分 布 式 数据 库 ， 并 展示 如 何 利 用 分 布 式 表 将 我 们 的 缓存 

系统 扩展 至 集群 中 的 多 个 市 点 上 。 

口 第 10 莉 讲 的 是 如 何 打包 发 布 一 个 或 多 个 Erlang/OTP 应 用 ,发 布 应 用 时 既 可 以 制作 独立 的 最 

小 安 汲 ， 也 可 以 将 其 附加 于 现 有 安装 。 男 外 还 会 介绍 发 布 包 的 部 署 方法 。 

第 三 部 分 讨论 如 何 让 代码 与 大 环境 融合 ,如 何 与 其 他 系统 和 用 户 集成 ,以 及 如 何 随 复 淋 上 度 的 
增加 不 断 优化 代码 。 

口 第 11 草 展示 了 如 何在 TCP 的 基础 之 上 为 缓存 应 用 增加 REST 风 格 的 HITP 接 口 。 通 过目 定义 

OTP 行 为 模式 ， 你 将 从 头 开发 和 目 己 的 Web 服 务 胡 。 

D 第 12 草 解释 了 Erlang 与 其 他 语言 开发 的 系统 进行 通信 的 基本 机 制 。 本 章 展 示 了 三 种 接 和 人 第 
三 方 C 库 的 途径 : 普通 端口 、 端 口 驱动 以 及 NIF。 

口 第 13 草 展示 了 用 Jinterface 库 集成 Java 代 码 的 方法 ，Java 程 序 可 以 借 此 模拟 成 特殊 的 节点 从 
而 接 和 Erlang 集 群 。 随 后 我 们 将 利用 这 种 方法 在 绥 存 应 用 的 后 方 接 和 人 一 个 用 于 提供 后 端 存 
储 文 持 的 Hadoop HBase 数 据 库 。 

口 第 14 章 讲 的 是 Erlang/OTP 系 统 的 性 能 评测 和 优化 ,解释 了 主要 代码 评测 工具 的 使 用 并 讨论 
了 一 些 有 助 于 系统 调 优 的 实现 细节 。 

本 书 特 意 避 开 了 gen_fsm 行 为 模式 ， 因 为 在 实践 中 它 的 用 途 非常 有 限 。 本 书 详尽 论述 了 有 关 
OTP 行 为 模式 的 最 关键 的 内 容 ， 和 车 握 这 些 内 容 ， 你 便 可 以 充分 理解 OTP 行 为 模式 ， 进 而 轻松 地 通 
过 官方 文档 目 学 gen_fsm。gen_fsm 的 拿手 好 戏 是 二 进 制 协议 解析 ; 但 普通 的 gen_server 配 合 
恰当 的 模式 往往 更 为 适用 ， 而 且 也 更 为 灵活 。 对 于 希望 学 习 gen_fsm 的 该 者 ， 我 们 很 抱 菊 ， 不 过 
总 的 来 说 其 余 的 几 个 主要 OTP 行 为 模式 会 更 为 称 手 。 


源 代码 
有 别 于 普通 文本 , 列 于 清单 内 或 穿插 于 正文 中 的 源码 都 使 用 等 宽 字体 , 像 这 样 fixed-wiath 


font like this。 许 多 代码 清单 都 附 有 注释 ， 用 于 强调 重要 概念 。 部 分 源码 附 有 标号 ， 分 别 对 
应 于 代码 清单 后 的 解释 。 










































































图 灵 社 区 会 员 for(;;)(13433955876@163.com) 专 享 尊重 版 权 


关于 本 书 XIII 


本 书 中 的 源码 可 以 从 http://github.com/erlware/Erlang-and-OTP-in-Action-Source 下 载 (也 可 以 直 
接 到 | github.com 上 搜索 书 名 ), 出 版 社 的 站 点 也 提供 下 载 : www.manning.com/ErlangandOTPinAction 
或 ituringbook. com. cn/book/828。 


作者 在 线 


购买 本 书 的 读者 可 以 免费 访问 Manning 出 版 社 的 专 有 论坛 ， 在 此 你 可 以 对 本 书 发 表 评 论 ， 询 
问 技术 问题 ， 或 是 回 作 者 和 其 他 用 户 寻 求 帮 助 。 访 问 和 订阅 该 论坛 请 移 步 http:/www.manning- 
sandbox.conyforum.jspa?forumID=454。 注册 后 便 可 在 页 面 上 找到 论坛 的 访问 方法 、 在 此 能 获得 哪 
一 类 帮助 ， 以 及 论坛 的 行为 准则 。 

Manning 承 诺 为 公众 提供 读者 和 读者 之 间 以 及 读者 和 作者 之 间 的 交流 途径 ， 但 无 法 承诺 作者 
的 参与 度 。 作 者 在 本 书 论坛 上 发 帖 都 是 自愿 〈( 且 无 偿 ) 的 。 我们 建议 读者 多 癌 作 者 提 一 些 有 挑战 
的 问题 ， 好 激发 他 们 参与 的 兴 

作者 在 线 论坛 及 本 书 出 版 至 今 的 讨论 合集 都 可 通过 出 版 社 的 网 站 访问 。 


大 于 封面 插图 


本 书 封 面 插图 的 标题 叫 “ 阿 尔 特 温 人 ”( An Artvinian )， 这 是 居住 在 土耳其 东北 部 阿尔 特 温 
地 区 的 届 民 。 插 图 取 目 一 本 描绘 奥斯曼 带 国 服饰 的 画册 ， 这 本 画册 由 伦敦 老 邦 德 街 的 William 
Miller 于 1802 年 1 月 1 日 出 版 。 画 册 的 剧 页 已 经 丢失 ， 因 此 很 难 推断 准确 的 创作 时 间 。 男 册 的 目录 
同时 使 用 英语 和 法 语 标 识 插图 , 男 外 每 张 图 片 还 附 有 两 名 创作 它 的 艺术 家 的 名 字 。 他 们 一 定 想 不 
到 ……: 目 己 的 作品 竟然 会 在 两 百年 后 被 用 作 某 本 计算 机 编程 图 书 的 封面 。 

这 本 画册 是 Manning 的 一 位 编辑 从 古董 跳蚤 市 场 上 淘 来 的 ， 那 地 方位 于 曼哈顿 西 26 号 大 街 的 
Garage。 卖 家 是 个 住 在 土耳其 安卡拉 的 美国 人 ， 谈 这 桩 灭 喜 的 时 候 他 正 要 收工 回 家 。 当 时 这 位 
Manning 编 辑 结 上 没 币 够 钱 ， 信 用 卡 和 支票 义 补 婉拒。 而 卖家 当晚 就 要 飞 回 安 卡拉 ， 这 么 一 来 似 
乎 就 没 指望 了 。 那 最 后 怎么 办 呢 ? 两 个 人 最 后 通过 握手 约定 的 老式 君子 协 以 解决 了 问题 。 卖 家 提 
以 通过 银行 转账 付 秩 ， 于 是 我 们 的 编辑 在 纸 上 记 下 银行 信息 后 便 掖 着 一 包 画 册 离 开 了 。 不 用 说 ， 
第 二 天 我 们 就 把 钱 转 了 过 去 。 一直 以 来 , 我 们 都 次 次 地 感激 这 位 兽 对 我 们 的 同事 抱 以 信任 的 阳 生 
人 。 这 真 让 人 无 比 怀 念 那 充满 信任 的 朴 和 又 的 旧时 代 。 

奥斯曼 画册 上 的 那些 画 , 正如 出 我 们 用 在 其 他 封面 上 的 那些 插图 一 样 ,， 桶 棚 如 生地 展现 了 两 
个 世纪 前 的 丰 军 多彩 的 服饰 。 抛 开 当 今 这 个 过 度 文 配 的 时 代 , 它们 代表 者 那个 年 代 以 及 其 他 历史 
时 期 的 分 隅 和 距离 。 衣 关 习 俗 从 那 时 开始 改变 ， 此 前 不 同 地 域 的 服饰 的 绚丽 多 姿 开 始 逐 渐 消 失 。 
当今 , 来 日 不 同 大 陆 的 人 仪 徘 衣 关 已 经 很 难 区 分 开 来 。 也许 乐观 地 看 , 我 们 正 是 用 文化 上 的 多 样 性 
和 视觉 上 的 差异 性 才 换 来 了 多 姿 多 彩 的 个 人 生活 。 亦 或 是 一 种 更 多 样 、 更 精彩 的 知识 与 技术 生活 。 

我 们 Manning 人 把 两 个 世纪 前 多 样 的 地 方 生 活 融 入 书籍 的 封面 ， 令 男 卷 复 外 ， 谭 以 此 表达 我 
们 对 计算 机 行业 的 创造 性 、 首 创 性 以 及 趣味 性 的 赞颂 。 
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Erlang 是 一 门 以 0 为 核心 概念 的 语言 。 什 么 是 进程 ? 电脑 上 同时 运行 春 的 多 个 程序 ， 比 方 
说 文字 处 理 软件 和 Web 浏 览 硕 ， 彼 此 便 运 行 在 各 目的 进程 之 中 。 文 字 处 理 软件 右 天 省， 通 篆 不 会 
影响 浏览 各 一 一 反之 亦 然 , 朋 沉 的 浏览 带 也 不 会 弄 丢 你 正在 编辑 的 文档 。 进 程 就 像 是 菜 种 在 并 行 
执行 流程 间 起 隔离 保护 作用 的 隔膜 ，Erlang 便 是 完全 围绕 进程 来 构建 起 来 的 。 

在 Erlang 中 创建 进程 兄 如 反 掌 一 一 这 就 像 是 在 Java 等 语言 中 创建 0 一 样 简 单 。 进 程 变 得 如 
此 廉价 ， 使 得 我 们 得 以 从 不 同 的 视角 来 看 待 系统。Erlang 程 序 中 的 任何 独立 活动 都 可 以 被 视 作 单 
独 的 进程 。 没 有 星 深 的 事件 循环 ,也 没有 线程 池 ， 所 有 这 些 烦人 的 实现 细 市 统统 都 可 以 抛 开 。 即 
便 程 序 需 要 同时 运行 10 000 个 进程 来 完成 条 个 任务 ， 也 可 以 轻松 搞定 。 阅 读本 书 时 你 会 发 现 ， 
Erlang 可 以 极 大 地 改变 我 们 看 竺 系统 的 方式 。 我 们 和 硕 望 让 你 看 到 , 系统 可 以 以 更 直观 (也 更 遍 效 ) 
的 方式 得 以 呈现 。 

Erlang 还 是 一 门 函 数 式 编 程 语言 。 别 害怕 ，Erlang 完 全 可 以 设计 得 更 贴近 你 所 熟悉 的 那些 主 
流 霹 言 ; 即便 不 价 助 消 数 式 编程 ,这 里 记述 的 各 种 特性 也 一 样 可 以 实现 。 但 函数 式 编程 所 具有 的 
引用 透明 性 、 高 阶 胃 数 、 不 可 变数 据 结 构 等 儿 大 特点 ， 它 们 本 刁 就 很 值得 引入 Erlang。 函 数 式 纺 
程 位 洁 优 雅 地 融合 并 呈现 了 这 些 特点 。 要 不 是 引入 了 了 铬 数 式 编程 ，Erlang 只 会 变 得 更 为 复 淋 ， 也 
不 可 能 那么 令 人 和 居 悦 。 









































Erlang 诞 生 记 


你 头 一 回 听 说 Erlang 时 , 它 多 半 是 锌 定 性 为 一 门 “ 上 因数 式 并 发 编程 语言”， 而 你 大 概 也 会 党 得 
它 听 起 来 更 像 是 茶 种 学院 小 的 、 不 实用 的 玩具 博 言 。 但 我 们 要 强调 的 是 ，Erlang 从 一 开始 就 致力 
于 解决 真实 的 大 规模 软件 工程 问题 。 为 了 把 话说 清楚 ， 我 们 得 匈 好 好 聊 聊 这 门 语言 育 后 的 历史 。 


与 C 比 较 


Erlang 和 C 语 言 的 背景 掺 为 相似 。 首 和 完 ， 二 者 都 源 晶 大 型 电信 公司 ,都 是 由 某 个 环境 相对 轻 
松 的 研发 部 门 里 的 几 个 人 创造 出 来 的 。 两 门 语言 的 创造 者 都 是 目 在 之 人 , 但 他 们 同时 也 都 是 试图 
去 解决 具体 问题 的 务实 的 工程 师 。 对 于 C 来 说 ， 要 解决 的 问题 是 如 何在 硬件 资源 受 限 〈 相 对 那 时 
而 言 ) 的 情况 下 ， 用 比 汇编 更 局 级 的 语言 来 开发 系统 软件 。 对 于 Erlang 来 说 ， 问 题 则 在 于 如 何 让 
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程序 员 开 发 超大 规模 、 高 并 发 和 强 容错 的 软件 ,并 彻 确 改善 生产 效率 、 减 少 软件 缺陷 的 数量 一 一 
这 可 真 不 是 疝 春 玩 儿 的 。 

两 种 语言 的 第 一 批 奶 随 者 都 来 目 公 司 内 部 ， 这 些 人 在 各 种 内 部 项 目 和 实际 产品 中 使 用 它们 ， 
并 就 各 种 务实 的 细节 加 语 言 的 缔造 者 们 提出 了 宝 贯 的 前 期 反 锯 。 二 者 都 化 了 大 约 十 年 时 间 才 为 公 
众 所 知 ， 而 在 此 之 前 ， 它 们 都 出 色 地 经 受 住 了 实战 的 检验 。C 诞 生 于 1972 年 左右 ,流行 于 20 世 纪 
80 年 代 。 同 样 ，Erlang 成 形 于 1988 年 ， 直 到 1998 年 才 以 开源 的 形式 对 外 发 布 。 在 公司 外 部 ， 两 种 
语言 完 友人 燃 的 都 是 研究 机 构 和 大 学 的 兴趣 。 当 然 ， 出 于 历史 原因 它们 各 有 各 的 缺点 , 但 一 般 来 说 
我 们 并 不 在 乎 ， 因 为 也 只 有 它们 真正 地 解决 了 问题 。 
让 我 们 把 目光 转向 过 去 。 


20 世纪 80 年 代 中 期 ， 斯 德 哥 尔 摩 : 那个 自由 散漫 的 类 国人 


Erlang 放 生 自 一 个 研究 项 目 ， 该 项 目 旨 在 寻求 一 种 更 好 的 编程 方式 ， 用 以 开发 当时 电信 业内 
那些 大 流量 、 高 并 发 、 猛 龙 一 般 永生 不 死 的 控制 系统 。Joe Armstrong 于 1985 年 加 入 这 个 项 目 ， 
来 到 了 位 于 瑞典 斯 德 哥 尔 摩 的 爱立信 计算 机 科学 实验 室 。 

这 个 项 目的 主要 任务 就 是 用 尽 可 能 多 的 编程 语言 来 实现 同一 类 通话 控制 系统 ,涉及 的 语言 
括 Ada、CLU、Smalltalk 等 。 最 终 的 结果 结论 性 并 不 强 ， 虽 然 很 明显 上 上 之 选 是 用 机 数 式 和 逻辑 
语言 并 采取 高 级 的 声明 式 风 格 来 进行 开发 ， 但 当时 还 没有 哪 种 语言 具备 合适 的 并 发 模型 。 

但 谁 知 道 好 的 并 发 模型 是 个 什么 样 呢 ? 那 时 〈 以 及 之 后 近 二 十 年 间 )， 并 发 方面 的 主要 研究 
要 么 集中 在 CSP 、Ppi 演 算 这 样 的 纯 抽 象 进程 模型 和 并 发 逻辑 语言 上 ， 要 么 就 集中 在 信和 号 量 
(semaphore )、 监 视 右 ( monitor ) 和 信号 〈signal ) 这 类 底层 机 制 上 。 

与 此 同时 , 工程 师 们 仍然 要 解决 各 种 大 规模 并 发 容错 通信 系统 的 实际 问题 。 当 时 的 爱立信 已 
经 有 了 独门 秘籍 , 那 是 一 套 专 有 的 揉 合 了 编程 语言 和 操作 系统 的 混合 解决 方案 , 名 为 PLEX, AXE 
电话 交换 机 的 成 功 就 要 归功 于 它 。 


让 人 抓 狂 的 需求 


PLEX 是 一 门 相 对 常规 的 命令 式 编程 语言 ， 但 它 为 后 继 者 立 下 了 一 系列 标杆 : 

口 进程 必须 是 语言 的 核心 ; 

口 任何 进程 不 得 损坏 其 他 进程 的 内 存 空 间 ， 不 得 遗留 悬空 指针 ; 

口 由 于 要 同时 跑 数 万 旋 至 数 十 万 个 进程 ， 进 程 创建 和 任务 切换 的 速度 必须 要 快 ， 单 个 进程 
的 内 存 占用 量 必须 非常 小 ; 

口 必须 能 够 隔离 单个 进程 的 故障 ; 

口 必须 能 够 在 运行 时 对 系统 进行 代码 升级 ; 

































































Q 本 节 标 题 中 的 “英国 人 ” 指 的 就 是 Erlang 之 父 Joe Armstrong。 说 他 “自由 散漫 ”是 因为 当时 他 在 爱立信 所 参与 的 
人 研究 项 目 本 身 就 比较 发 散 ， 自 由 度 比 较 大 。 一 一 译 者 注 
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口 必须 能 够 同时 检测 和 处理 软 便 件 销 误 。 
与 此 最 相近 的 语言 当 属 Parlog 和 Strand 等 并 发 逻辑 语言 ， 但 它们 对 进程 有 着 不 同 的 定义 ， 进 
程 的 粒度 更 细 ， 对 单个 进程 的 控制 力也 很 弱 。 





Erlang 的 诞生 


一 天 , Joe 发 现 Prolog 基 于 规则 的 编程 风格 可 以 很 好 地 匹配 他 之 前 为 描述 通话 控制 问题 而 发 明 
的 手写 标记 法 ， 于 是 他 开始 编写 一 个 Prolog 的 元 解释 器 "。 通 过 这 种 方式 ， 他 扩展 了 Prolog， 模 拟 
出 进程 切换 ， 用 以 并 发 运行 多 个 电话 呼叫 。 

很 快 ,解释 需 所 能 识别 的 表达 式 形 成 了 一 个 文 持 进程 和 消息 传递 的 小 型 语言 ;虽然 是 用 Prolog 
实现 的 , 但 它 更 简单 ， 而 且 是 函数 式 的 , 也 没有 用 上 Prolog 的 合 一 ”和 回溯 特性 。 没 多 和 久 , 便 有 人 
一 语 双 关 地 提议 将 之 命名 为 Erlang ( 一 方面 指 丹 麦 数学 家 A.K. Erlang， 他 因 在 通信 系统 统计 领域 
的 贡献 而 为 电信 工程 师 们 所 熟知 ; 一 方面 它 也 是 Ericsson Language 的 简写 )。 

就 这 样 ， 开 发 小 型 但 可 工作 的 通话 控制 系统 的 需求 驱动 着 早期 Erlang 的 演化 。 特 别 是 消息 传 
递 原 语 的 设计 ,完全 是 出 于 大 型 电信 系统 的 实际 需要 , 绝 非 为 了 迎合 某 个 特定 的 并 发 理论 。 这 里 
所 说 的 消息 传递 原声 , 指 的 是 异步 的 消息 发 送 操作 符 、 目 动 消息 缓存 和 乱 序 的 选择 性 消息 接收 机 
制 (这 一 设计 深 受 用 于 规范 复 淋 通信 系统 协议 的 CCITT SDL 标 记 法 的 有 影响 )。 

1988 年 , 一群 真正 的 用 户 进 行 了 初期 实验 ， 开发 了 一 个 全 新 的 电信 和 架构， 事实 证 明 该 语言 极 
大 地 提升 了 生产 效率 , 但 当时 的 实现 实在 是 太 慢 了 。 于 是 从 1990 年 起 , Joe、Mike Williams 和 Robert 
Virding 开 始 实现 Erlang 的 第 一 个 抽象 机 。 这 个 抽象 机 名 叫 JAM， 是 一 个 用 C 写 成 的 堆栈 机 ， 比 起 
最 初 的 Prolog 实 现 要 快 上 70 倍 。 

1993 年 ， 第 一 本 Erlang 书 籍 出 版 ， 并 于 1996 年 再 版 。 直 到 这 时 ，Erlang 才 终于 可 以 算得 上 是 

- 门 真正 的 语言 了 。” 


发 展 壮大 


在 后 来 的 年 月 里 ，Erlang 叉 累积 了 许多 特性 ， 如 分 布 式 、 记 录 语 法 、 预 处 理 带 、Lambda 表 达 
式 (fun 语句 )、 列 表 速 构 、Mnesia 数 据 库 、 二 进 制 数据 类 型 以 及 比特 位 语法 等 。 整 个 系统 也 被 移 
植 到 了 Windows、VxWorks 和 QNX 等 非 UNIX 平 台 上 。 

1995 年 ， 随 着 一 个 巨型 C++ 项 目的 分 骨 离 析 ，Erlang 在 爱立信 内 部 获得 了 空前 的 发 展 。 该 项 
目 被 推倒 重 来 ， 这 回 用 的 正 是 Erlang 以 及 “不 过 60 个 ”程序 员 ; 另外 还 有 一 个 徘 谱 的 语言 支持 音 
门 一 一 OTP 团 队 一 一 来 给 他 们 做 后 盾 。 最 终 的 成 果 便 是 取得 了 巨大 成 功 的 AXD301 系 统 ， 整 个 系 
统 由 一 百 多 万 行 Erlang 代 码 锻造 而 成 。 


















































中 元 解释 器 ( meta-interpreter )， 这 里 指 用 Prolog 写 的 Prolog 解 释 器 。 一 一 译 者 注 

@) 全 一 (unification )， 该 译 法 取 自 Wikipedia ( http://zh.wikipedia.org/wiki/ 合 一 )。 一 一 译 者 注 

(3) 这 段 历史 可 以 参见 Joe Armstrong 发 表 于 2007 年 的 A History of Erlang， 其 中 记载 了 大 量 Erlang 的 设计 理念 和 趣闻 。 
译 者 注 
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与 此 同时 ，1998 年 ， 马 普 萨 拉 大 学 的 一 群 学 生 正 将 Erlang 本 地 代码 编译 作为 他 们 的 硕士 论文 
课题 ， 并 以 此 成 立 了 0 0 0 Erlang 研 究 组 ; 最 终 ，HiPE ( High Performance Erlang ) 本 地 代码 编译 
希 被 整合 进 标准 Erlang/OTP 发 行 碑 。 此 外 , 爱立信 的 一 个 内 部 项 目 曾 试图 将 Erlang 编 译 为 C 来 提高 
执行 效率 ， 终 因 生 成 的 代码 过 大 而 失败 。 然 而 该 项 目 却 衍 生出 了 BEAM, 一 个 更 快 的 、 基 于 寄存 
希 的 多 线程 代码 抽象 机 ， 一 举 取代 了 老 旧 的 JAM。 

但 在 20 世 纪 90 年 代 晚 期 ， 随 着 Java 兴 起 ， 爱 立信 公司 高 层 认 为 不 该 把 人 力 投 入 到 目 创 的 编程 
语言 的 开发 维护 中 去 ， 而 应 该 采用 “全 志 界 通用 的 语言 "。 因 此 ，Erlang 被 禁止 用 于 新 项 目 。 最 终 
管理 层 被 说 服 将 Erlang 开 源 ， 以 便 造 福 爱立信 以 外 的 用 户 。 事 情 发 生 于 1998 年 12 月 ， 很 快 ， 为 数 
不 少 的 核心 开发 者 选择 离职 并 共同 创建 了 一 家 小 公司 ， 借 由 Erlang 和 丰富 的 电信 经 验 ， 这 批 人 很 
快 就 赚 到 了 第 一 桶 金 。 

大 获 成 功 

渐渐 地 , 外 部 用 户 越 来 越 多 。 随 着 时 间 的 流逝 , 爱立信 的 人 们 也 开始 将 禁令 抛 到 脑 后 , Erlang 
的 作用 大 得 令 人 难以 抗拒 ,现存 的 系统 也 不 再 被 要 求 用 别 的 语言 重 写 了 。OTP 团 队 继 续 开 发 和 维 
护 Erlang， 爱 立信 也 持续 资助 着 HiPE 项 目 ， 以 及 EDoc 和 Dialyzer 等 许多 衍生 应 用 。 

在 学 术 界 ，Erlang 则 被 公认 为 一 门 成 熟 旦 有 价值 的 函数 式 编程 语言 。 自 2002 年 起 ，ACM 
SIGPLAN 开 始 资助 一 年 一 度 的 Erlang Workshop， 使 之 成 为 与 1CFP ( 国际 函数 式 编 程 会 议 ) 平 起 
平和 坐 的 年 度 戌 会 。 而 最 令 人 目 紧 的 则 是 Erlang 的 并 发 模型 成 为 了 许多 其 他 编程 语言 争 相 实验 和 效 
仿 的 对 象 ; 不 过 正如 许多 人 所 见 ， 这 蕊 后 炮 也 不 是 那么 容易 放 的 哆 。 

2006 年 ， 当 硬件 产业 开始 承认 目 身 已 然 甬 及 单 核 处 理 大 的 性 能 瓶 祷 时，Erlang 发 布 了 第 一 
个 支持 SMP 的 版 本 , 这 是 爱立信 的 OTP 团 队 和 HiPE 团 队 通 力 合作 的 成 果 。 接着 , 在 2007 年 ,Joe 
的 新 书 Programming Erlang(《 Erlang 程 序 设 计 》) 面世 ( 此 时 距 Erlang 的 第 一 本 书 出 版 已 10 年 有 
余 ) 一 一 一 时 之 间 ，Erlang 变 成 了 全 球 瞩 目的 焦点 。 大 大 小 小 的 公司 都 争 相 用 它 创建 各 种 不 可 思 
以 的 应 用 。 

本 书 的 故事 便 从 这 里 开始 了 。 
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Erlang 起 步 : OTP 基础 





本 书 第 一 部 分 座 入 介绍 各 种 基本 原理 。 我 们 会 和 多 快速 训 览 一 过 语言 基础 ， 再 来 学 习 一 些 
OTP 的 基本 部 件 ， 而 这 些 部 件 将 成 为 构建 贯穿 于 本 书后 续 内 容 中 各 种 现实 场景 的 基石 。 
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Erlang/OTP 平 合 





本 章 概要 

口 理解 并 发 和 Erlang 的 进程 模型 

口 Erlang 的 容错 与 分 布 式 支 持 

D Erlang 运 行 时 系统 的 重要 属性 

口 什么 是 浮 数 式 编 程 ， 如 何 用 Erlang 进 行 阴 数 式 编程 











既然 你 正 读者 这 本 书 ， 想 必 知 道 Erlang 是 一 门 编程 语言 一 一 而 且 还 是 一 门 很 有 意思 的 语言 ， 
但 正如 书 名 所 示 ， 我 们 所 关注 的 是 如 何 用 Erlang 创 建 真实 而 鲜 活 的 系统 。 为 了 实现 这 一 日 标 ， 我 
们 束 需 要 OTP 框 架 。Erlang 的 任何 发 布 版 本 都 融 有 这 套 框 架 ， 它 与 Erlang 紧 密集 成 ,已 令 人 难以 
将 之 与 普通 Erlang 标 准 库 明确 地 区 分 开 来 。 因 此 ， 我 们 常用 Erlang/OTP 来 同时 指 代 二 者 或 其 中 之 
一 。 尽管 二 者 间 的 关系 如 此 密切 , 但 真正 明了 OTP 的 用 途 与 运用 之 道 的 Erlang 程 序 员 却 为 数 不 多 ， 
即便 真相 往往 只 有 一 步 之 遥 。 就 让 本 书 来 为 你 带路 吧 。 




















OTP 是 什么 意思 

OTP 最 初 是 开放 电信 平台 (Open Telecom Platform ) 的 缩写 ，Erlang 开源 前 这 个 名 字 多 少 
还 有 点 品牌 效应 。 如 今 可 没 人 稀罕 它 了 ; 现在 OTP 就 是 OTP。 无 论 Erlang 还 是 OTP 都 早已 不 
再 局 限于 电信 应 用 : 更 贴切 的 名 字 应 该 是 “DDDDDD"。 








作为 编程 语言 ，Erlang 可 以 简化 高 度 并 行 分 布 式 容错 系统 的 构建 ， 并 以 此 闻名 。 在 跳 到 OTP 
框 杂 相 关内 容 之 前 ， 我 们 会 匈 在 第 2 草 对 该 语言 作 一 个 全 面 的 综述 。 不 过 话说 回来 ， 为 什么 非 学 
OTP 不 可 呢 ? 或 许 你 更 乐于 埋头 实现 上 自己 的 解决 方案 ?” 且 让 我 们 来 看 看 OTP 的 优点 : 
口 生产 效率 一 一 运用 OTP 可 在 短 时 间 内 交付 产品 级 的 系统 ; 
D 稳定 性 一 一 基于 OTP 的 代码 可 以 更 集中 于 逻辑 , 并 避免 重新 实现 那些 容 多 出 错 而 每 个 实际 
系统 又 都 必 备 的 基础 功能 ， 如 进程 管理 、 服 务 禹 、 状 态 机 等 ; 
口 监督 一 一 这 是 由 框架 提供 的 一 登 简 便 的 监视 和 控制 运行 时 系统 的 机 制 ， 际 有 日 动 化 方式 ， 
也 有 图 形 用 户 寞 面 方式 ; 
口 可 升级 一 一 框 染 为 处 理 代码 升级 提供 了 一 套 系 统 化 的 模式 ; 
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1.1 基于 进程 的 并 发 编程 a 


口 可 靠 的 代码 库 一 一 OTP 的 代码 坚 如 兢 石 并 全 部 经 过 严格 的 实战 检验 。 

尽管 有 诸多 优点 ， 但 锅 怕 对 大 部 分 Erlang 程 序 员 来 说 ，OTP 仍 然 神 秘 莫 测 ， 必 须 在 艰深 的 文 
档 中 措 爬 滚 打 千 锤 百 烁 方 能 习 得 。 而 这 正 是 我 们 所 要 改变 的 状况 。 据 我 们 所 知 , 本 书 是 第 一 本 专 
注 于 OTP 学 习 的 书 ， 而 我 们 想 要 告诉 你 的 是 这 一 过 程 远 比 你 想象 的 要 轻松 。 我 们 保证 你 学 了 肯定 
不 会 后 悔 。 

在 本 书 结束 时 ,你 将 完整 地 掌握 OOTP 框架 中 的 概念 、 库 与 编程 模式 ， 学 会 如 何 运 用 OTP 的 组 
件 和 理念 开发 单个 Erlang 程 序 及 整套 基于 Erlang 的 系统 ， 并 令 其 兼 具 容错 、 分 布 、 并 发 、 高 效 和 
多 于 监控 的 特点 。 你 可 能 还 会 学 到 一 些 此 前 未 曾 留 意 过 的 有 关 Erlang 语 言 、 运 行 时 系统 、 库 和 工 
具 的 细节 。 

本 章 我 们 所 要 讨论 的 是 Erlang/OTP 平 台中 的 那些 用 于 构建 OTP 本 和 刁 的 核心 概念 和 特性 ， 包括: 

口 并 发 编程 ; 

D 容错 ; 

口 分 布 式 编程 ; 

口 Erlang 虚 拟 机 和 运行 时 系统 ; 

口 Erlang 的 核心 限 数 式 语 言 。 

我 们 不 会 一 上 来 就 臂 头 盖 脸 地 扔 出 一 大 把 概念 , 此 处 的 重点 是 让 你 了 解 各 种 具体 内 容 背 后 的 
思想 ， 以 便 更 好 地 理解 后 续 第 >、3 章 中 论 及 的 具体 内 容 。Erlang 很 特别 ， 本 书 中 的 诸多 内 容 都 需 
要 兹 费时 间 去 适应 。 在 深入 技术 细 届 之 前 ， 我 们 希望 这 一 草 能 让 你 明日 各 种 机 制 背 后 的 动机 。 


1.1 基于 进程 的 并 发 编程 


Erlang 为 了 解决 0 0 问题 一 一 也 就 是 让 多 个 任务 同时 运行 一 一 采用 了 全 新 的 设计 。 并 发 是 设 
计 该 语言 时 的 核心 关注 点 。 借 助 进 程 的 概念 ，Erlang 内 置 的 并 发 文 持 可 以 彻底 隔离 任务 ， 令 你 设 
计 出 容错 的 染 构 ， 并 充分 发 挥 当今 多 核 便 件 的 能 力 。 不 过 在 继续 深入 之 前 ,我 们 有 必要 把 并 发 和 
进程 这 两 个 术语 的 确切 含义 解释 清楚 。 


1.1.1 理解 并 发 


并 发 就 是 并 行 吗 ? 不 完全 是 ， 至 少 在 讨论 计算 机 和 编程 时 二 者 并 不 等 同 。 

有 个 第 用 的 半 正 式 定 义 是 这 么 说 的 :“ 并 发 , 用 于 形容 那些 无 须 以 特定 顺序 执行 的 事物 。 比 
如 分 别 对 两 副 碑 排序 ,你 可 以 排 完 一 副 再 排 为 一 副 ; 三 头 六 壁 的 话 也 可 以 两 副 并 行 一 起 来 。 这 两 
个 任务 在 执行 顺序 上 不 受 约束 ， 因 此 ,它们 是 并 发 任务 。 它 们 的 完成 顺序 也 无 所 请 ,你 可 以 在 两 
个 任务 间 交 蔡 切 换 直 至 二 者 全 部 完成 ; 倘 厂 有 多 余 的 手脚 (或 是 多 个 帮手 )， 也 可 按 真正 的 并 行 
方式 同时 进行 。* 















































关于 “并 行 ”与 “并 发 ”的 区 别 ， 另 一 个 常见 的 说 法 是 ,“ 并 行 ”形容 两 个 或 多 个 任务 在 同一 时 间 同 时 发 生 ， 而 
“并 发 ”形容 两 个 或 多 个 任务 在 一 个 时 间 段 内 交替 进行 ， 同 一 时 间 内 只 有 -一 个 任务 在 执行 。 而 本 书 中 的 定义 则 将 
“并 行 ” 列 为 “并 发 ”的 一 个 概念 子 集 。 一 一 译 者 注 
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4 第 1] 章 Erlang/OTP 平台 








这 听 起 来 好 像 有 点 怪 : 只 有 同时 发 生 的 任务 才能 算是 并 发 任务 吧 ? 嗯 , 这 个 定义 的 关键 在 于 
它们 可 以 同时 发 生 , 而 我 们 则 可 以 按 目 己 的 意愿 随意 调度 它们 。 有 些 必须 同时 进行 的 任务 相互 之 
间 根 本 无 法 独立 ; 还 有 些 任务 相互 之 间 虽 然 独立 却 不 并 发 ， 必 须 按 特定 的 顺序 进行 ， 比 如 做 重 卷 
必须 先 打 重 。 除 了 这 些 情 况 其 余 都 算 并 发 。 

Erlang 的 一 大 优势 就 是 它 玫 你 隐藏 了 任务 实际 执行 的 细 方 。 如 图 1-1 所 示 ， 如果 有 和 额外 的 CPU 
(或 核 ， 或 超 线程 )，Erlang 会 利用 它们 并 行 执行 更 多 并 发 任务 。 如 果 没 有 ，Erlang 会 利用 现 有 的 
CPU 处 理 能 力 一 点 一 点 地 区 蔡 执 行 任务 。 你 不 必 操 心 这 些 细节 ，Erlang 程 序 能 够 目 动 适 配 不 同 的 











便 件 一 一 CPU 越 多 它们 跑 得 越 快 ， 前 提 是 任务 的 组 织 方式 允许 它们 被 并 发 执行 。 


Erlang 虚 拟 机 Erlang 虚 拟 机 





单 处 理 器 硬件 上 的 多 处 理 器 硬件 上 的 
Erlang 进 程 Erlang 进 程 


图 1-1 分 别 运 行 于 单 处 理 器 人 硬件 和 多 人 处理 器 人 硬件 上 的 Erlang 进 程 。 运 行 时 系统 会 自动 
将 负载 分 配 到 可 用 的 CPU 资源 上 


但 和 右 任 务 就 是 无 法 并 发 呢 ? 右 你 的 程序 就 必须 匈 执 行 X, 再 轮 到 Y, 最 后 是 Z 呢 ?这 时 你 就 得 
好 好 考虑 一 下 行 解决 的 问题 中 所 隐 合 的 实际 的 依赖 关系 了 。 也 许 X 和 Y 无 所 谓 谁 先 谁 后 ， 只 要 它 
们 在 Z 之 前 完成 就 行 。 又 或 许 X 和 Y 和 名目 完 成 了 一 部 分 的 时 候 就 可 以 部 分 局 动 Z。 在 这 个 问题 上 没 
有 捷径 可 循 ， 但 往往 稍微 动 下 脑筋 便 收 歼 甚 佳 ， 越 有 经 验 越 容 易 。 

重新 考察 问题 ， 削 减 任务 间 不 必要 的 依赖 , 可 以 令 代 码 在 现代 便 件 上 运行 得 更 为 高 效 。 但 这 
通 稍 不 该 是 你 的 首要 关注 点 。 将 程序 中 内 聚 性 低 的 部 分 隅 离 成 独立 的 任务 ,最 重要 的 收益 是 更 清 
晰 可 读 的 代码 ,你 的 精力 也 得 以 集中 到 实际 问题 上 ; 相反 ,试图 一 跳 而 就 一 次 性 完成 多 个 任务 只 
会 令 你 事倍功半 。 这 种 隅 离 意味 着 生产 效率 的 提高 和 缺陷 数量 的 降低 。 但 首先 , 我 们 需要 一 种 更 
具体 的 表征 独立 任务 的 手段 。 












































1.1.2” ”Erlang 的 进程 模型 


在 Erlang 中 ， 并 发 的 基本 单位 是 进程 。 每 个 进程 代表 一 个 持续 的 活动 ， 它 是 菏 段 程序 代码 的 
执行 代理 ,与 其 他 按 各 目的 节 委 执行 目 生 代码 的 进程 一 起 并 发 运行 。 进 程 和 人 有 些 相似 : 个 人 占 
有 的 东西 不 能 与 他 人 共用 。 这 不 是 慷慨 与 否 的 问题 ， 以 食物 为 例 ,， 你 多 吃 一 口 ， 别 人 必定 少 吃 一 
口 ; 更 天 键 的 是 ,你 吃 了 不 干净 的 东西 ,也 只 有 你 一 个 人 会 生病 。 每 个 人 虱 凭 信 目 己 的 头脑 和 脏 
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人 舱 独 立 于 他 人 去 思考 和 生存 。 这 也 正 是 进程 的 行为 模式 ， 相 互 隔离 ,并 确保 目 吴 内 部 状态 的 改变 
不 对 其 他 进程 造成 影响 。 

进程 拥有 日 己 的 工作 内 存 空间 和 日 己 的 信箱 , 其 中 信箱 用 于 存放 外 来 消息 ; 而 许多 其 他 语言 
和 操作 系统 中 的 线程 却 是 共 至 相同 内 存 空间 的 并 发 活动 ( 随 之 而 来 的 是 层出不穷 的 互 躁 脚趾 的 机 
会 )。 因此 与 线程 相 比 ，Erlang 进 程 更 加 安全 , 不 会 有 人 在 周围 指 手 划 脚 ,也 不 必 担 心 有 人 在 下 一 
微 秒 出 其 不 意 地 修改 目 己 的 数据 。 因 此 我 们 说 进程 封装 了 状态 。 



































进程 的 一 个 实例 

以 Web 服务 器 为 例 : 服务 器 接收 网 页 请 求 ， 查 找 该 网 页 的 数据 ， 再 将 数据 传 回 请 求 发 起 
方 ( 有 时 会 先 分 块 ， 再 一 块 一 块 地 传输 )， 如 果 请 求 失败 则 需要 返回 一 条 错误 人 信息。 显然 ， 请 
求 与 请 求 之 间 的 关联 度 不 高 "; 然而 如 果 服 务 器 一 次 仅 接 受 一 个 请 求 ， 不 处 理 完 毕 就 不 受理 下 
一 个 的 话 ， 热 门 站 点 上 请 求 队列 的 长 度 很 快 就 会 过 千 。 

反之 ， 如 果 在 请 求 抵达 后 服务 器 立即 分 配 独 立 的 进程 来 处 理 请 求 的 话 ， 就 不 再 需要 队 
列 ， 大 部 分 请 求 整 体 的 处 理 时 延 也 将 趋 于 相等 。 这 时 单个 进程 所 封装 的 状态 就 是 请 求 中 的 
UREL、 响 应 的 接收 方 以 及 当前 请 求 的 处 理 进 度 。 请 求 处 理 完毕 后 ， 进 程 退 出 ， 清 理 掉 这 个 
请 求 并 回收 内 存 。 一 旦 某 个 bug 导致 某 个 请 求 失败 ， 只 有 对 应 的 那个 进程 会 前 溃 ， 其 他 进 
程 仍 完好 无 损 。 





由 于 进程 不 能 直接 改变 其 他 进程 的 内 部 状态 , 容错 便 相 对 容易 。 无 论 一 个 进程 执行 的 代码 有 
多 烂 ， 其 他 进程 的 内 部 状态 都 不 会 受 损 。 即 便 是 在 程序 内 较 细 粒 度 的 层面 上 , 你 也 同样 可 以 设置 
这 种 隅 离 ， 就 好 像 电 脑 茧 面 上 的 浏览 奉 和 文字 处 理 融 之 间 的 关系 一 样 。 事 实证 明 这 种 隅 离 非 常 有 
效 ， 后 续 我 们 讲 到 进程 监督 时 你 就 会 有 所 体会 了 。 

由 于 进程 之 间 互 不 共 圣 内 部 状态 , 它们 只 能 进行 复制 式 通 信 。 一 个 进程 要 跟 其 他 进程 交换 信 
上 县， 就 会 发 送 一 条 消息 。 这 条 消息 是 发 送 方 所 持 有 数据 的 一 个 只 读 副 本 。 消 息 传递 的 基本 语义 使 
分 布 式 与 Erlang 目 然 地 融 为 一 体 。 现 实生 活 中 , 你 是 无 法 共享 线路 上 的 数据 的 一 一 你 只 能 复制 它 。 
Erlang 的 进程 间 通 信 机 制 总 会 让 接收 方 获取 一 份 私有 的 消息 副本 ， 即 便 消 息 收 发 双方 同 处 在 一 合 
机 艇 上。 初 听 起 来 可 能 很 奇怪 ， 但 这 意味 着 网 络 编程 和 单机 编程 完全 一 样 ! 

这 种 分 布 透 明 性 文 持 令 Erlang 程 序 员 可 以 将 网 络 视 作 一 组 资源 的 集合 一 一 我 们 不 用 关心 进程 
X 和 进程 Y 是 否 运行 在 不 同 的 机 融 上 ， 因 为 无 论 它 们 运行 在 何 处 ， 通 信和 方法 都 一 样 。 我 们 将 在 下 
一 小 节 对 各 种 语言 和 系统 中 的 进程 通信 方式 做 一 个 综述 ， 以 让 你 明白 其 中 的 利 葡 权衡 。 



































1.1.3 4 种 进程 通信 沱 陈 








所 有 并 发 系统 的 核心 问题 ,都 是 信息 共 至 ,这 也 是 所 有 实现 者 都 必须 解决 的 问题 。 将 一 个 问 
题 切 分 为 右 干 不 同 的 任务 后 ,任务 间 如 何 通信 ? 这 个 问题 看 起 来 简 单 ， 实则 不 然 , 不 少 大 师 级 人 





中 不 过 ,在 Web 2.0 的 大 漳 下 ， 人 情况 可 能 有 所 不 同 。 一 一 译 者 注 


图 灵 社 区 会 员 for(;;)(13433955876@163.com) 专 享 尊重 版 权 


6 第 1 章 Erlang/OTP 平台 











物 都 在 这 个 问题 上 绞 尽 了 脑汁 ， 并 经 年 累 月 地 尝试 了 很 多 手段 , 其 中 一 些 被 收编 为 编程 语言 的 特 
性 ， 另 一 些 则 形成 了 独立 的 库 。 

我 们 将 简要 讨论 一 下 近年 来 受到 广泛 认同 的 四 种 进程 通信 手段 。 我 们 不 打算 在 此 耗费 过 多 的 
时 间 , 但 应 该 足以 让 你 大 致 了 解 当 今 各 种 语言 和 系统 中 的 进程 通信 手段 ， 同 时 我 们 会 着 重 介绍 它 
们 和 Erlang 的 区 别 。 这 4 种 手段 分 别 是 持 锁 共 序 内存、 软件 事 务 性 内 存 、future 和 消 明 传递。 让 我 
们 从 最 古老 但 仍旧 最 流行 的 方法 开始 。 

1. 持 锁 共 享 内 存 

共享 内 存 差 不 多 算得 上 是 我 们 这 个 时 代 的 GOTO : 身 为 当今 主流 的 进程 通信 技术 ， 它 不 仅 历 
史 悠 入， 而 且 跟 GOTO 语 名 一 样 ， 为 你 提供 了 一 大 把 搬 起 石头 古 自 己 的 脚 的 办 法 。 因 为 它 ， 世 代 
工程 师 都 对 并 发 产生 了 深 深 的 恐惧 (未 兽 对 此 心怀 旦 惧 的 人 只 是 尚未 党 试 过 时 了 )。 然 而 我 们 必 
须 承 认 ， 正 如 GOTO 一 样 ， 在 一 些 底层 场合 中 共享 内 存 是 无 法 取代 的 。 

在 这 种 范式 下 ， 两 个 或 多 个 进程 可 以 同时 读 写 一 块 或 多 块 常规 内 存 区 域 。 有 时 进程 需要 在 这 
些 内 存 区 域 上 执行 一 些 具备 原子 性 的 操作 序列 ,其 他 进程 在 操作 完成 前 不 得 访问 这 些 区 域 , 这 就 
需要 一 种 令 该 进程 阻止 其 他 进程 访问 这 些 区 域 的 方法 。 解决 之 道 就 是 锁 ; 一 种 一 次 仅 允 许 一 个 进 
程 访问 某 种 资源 的 构件 。 

锁 的 实现 需要 内 存 系统 的 支持 , 一 般 由 硬件 以 特殊 指令 的 形式 提供 支持 。 使 用 锁 的 时 候 进程 
之 间 必 须 通力 合作 : 所 有 进程 必须 先 获 取 锁 才能 访问 共享 内 存 区 域 , 访问 结束 后 还 要 将 锁 释 放 给 
其 他 进程 使 用 。 使 用 锁 必 须 万 分 小 心 ， 差 之 毫 厘 诬 以 千里 ， 因 此 ,操作 系统 或 编程 语言 分 别 以 系 
统 调 用 或 语言 构件 的 形式 提供 了 信号 量 、 监 视 涡 和 互 斥 量 等 以 基本 锁 为 基础 的 高 级 构件 , 用 以 确 
保 锁 的 请 求 和 释放 的 正确 性 。 尽 管 借 助 这 些 可 以 绕 开 最 棘手 的 问题 , 但 仍然 难以 克服 锁 的 诸多 缺 
点 。 随 便 列举 几 条 : 

口 即便 冲突 几率 很 低 ， 锁 的 开销 仍 难 以 忽略 ; 

口 它们 是 内 存 系统 中 的 竞争 热点 ; 

口 出 错 的 进程 可 能 将 正 处 于 加 锁 状 态 的 锁 弃 之 不 顾 ; 

口 当 锁 出 现 问题 时 极 难 调试 。 

还 有 就 是 ,用 锁 同 步 两 三 个 进程 还 没什么 问题 ,但 随 着 进程 数 的 增长 ， 形 势 便 会 越发 失控 。 
最 终 很 可 能 ( 在 很 多 情况 下 ， 几 乎 肯定 ) 会 引发 即便 是 经 验 最 老 到 的 开发 者 也 无 法 预见 的 复杂 
死 锁 。 

我 们 认为 最 好 只 在 底层 编程 场合 ， 比 如 在 操作 系统 内 核 中 ,处 理 此 类 同步 问题 。 但 当今 流行 
的 大 部 分 编程 语言 和 脚本 语言 中 都 能 看 到 锁 的 号 影 。 它 的 广泛 存在 可 能 是 因为 锁 本 里 的 实现 并 不 
复杂 ,同时 也 不 会 对 这 些 语言 的 编程 模型 造成 影响 。 遗 憾 的 是 , 虽然 多 处 理 右 系统 早 在 好 几 年 前 
就 已 经 普及 ， 人 锁 的 广泛 应 用 还 是 阻碍 了 我 们 对 并 发 问题 的 思考 和 对 大 规模 并 发 的 应 用 。 

2. 软件 事务 性 内 存 (STM) 

我 们 所 要 考察 的 第 一 种 非 传统 方法 就 是 STM ( Software Transactional Memory， 软 件 事务 性 内 
存 )。 目 前 可 以 在 Haskell 编 程 语言 的 GHC 实 现 和 基于 JVM 的 Clojure 语 言 中 看 到 这 种 机 制 。STM 将 
内 存 当 作 传 统 数 据 库 ， 用 事务 来 决定 何 时 写 入 什么 内 容 。 通常 ， 这 种 实现 以 一 种 乐观 方式 来 规避 
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锁 : 将 一 组 谈 写 访问 视 为 单个 操作 ， 帮 两 个 进程 同时 试图 访问 共享 区 域 ， 则 各 目 司 动 一 个 事务 ， 
最 终 只 有 一 个 事务 会 成 功 。 另 一 个 进程 会 得 知事 务 失败 , 并 应 该 在 检查 共 胖 区 域 的 新 内 容 后 重 试 。 
该 模型 直截了当 ， 谁 都 不 需要 等 竺 其 他 进程 释放 锁 。 

STM 的 主要 缺点 在 于 你 必须 重 试 失 败 的 事务 〈 当然 ， 它 们 可 能 再 三 失败 )。 事务 系 统 本 里 也 
会 有 比较 显著 的 开销 , 另外 在 确定 哪个 进程 成 功 之 前 , 还 需要 额外 的 内 存 来 存放 你 试图 写 入 的 数 
据 。 理 想 情 况 下 ， 系 统 应 该 像 文 持 虚 拟 内 存 那 样 对 事务 性 内 存 提 供 便 件 文 持 。 

对 程序 员 而 言 ， STM 的 可 控 发 性 看 起 来 比 锁 要 好 ， 只 要 苋 争 不 会 频繁 导致 事务 重启 ,并 发 的 
优势 就 能 充分 得 到 发 挥 。 我 们 认为 该 方法 本 质 上 是 持 锁 共享 内 存 的 变 体 , 它 在 操作 系统 层面 的 作 
用 要 更 其 于 应 用 编程 层面 。 不 过 针对 该 课题 的 研究 还 很 活跃 ， 局 面 还 可 能 会 出 现 改 观 。 

3. Future、Promise 及 同类 机 制 

另 一 个 更 现代 的 手段 是 采用 所 谓 的 future 或 promise。 这 个 概念 还 有 另 处 一 些 形 式 ; 在 E” 和 
MnultiLisp 等 语言 以 及 Java 的 一 个 库 中 可 以 找到 它 的 身影 。 类 似 的 还 有 Id 和 Glasgow Haskell 中 的 
I-var 和 M-var、Concurrent Prolog 中 的 并 发 逻辑 变量 ， 以 及 Oz 中 的 数据 流 变 量 。 

其 基本 思路 是 , 每 个 人 uture 代 表 一 个 被 外 包 到 其 他 进程 的 计算 结 采 , 该 进程 可 能 跑 在 别 的 CPU 
其 至 是 别 的 计算 机 上 。Future 可 以 像 其 他 对 和 象 一 样 被 四 处 传递 , 但 无 法 在 计算 完成 之 前 读 取 结 
必须 等 竺 计算 完成 。 这 种 方法 虽然 概念 帘 单 、 简 化 了 并 发 系统 中 的 数据 传递 , 但 也 令 程 序 在 远亲 
进程 故障 和 网 络 故障 面前 变 得 脆弱 : 计算 结果 尚未 就 绪 而 连接 又 不 竺 断 开 时 ， 试 图 访问 promise 
的 值 的 代码 便 会 无 所 适 从 。” 

4. 消息 传递 

正如 1.1.2 节 所 说 ，Erlang 进 程 乱 消息 传递 来 通信 。 这 意味 着 接 收 进程 实际 上 获取 了 一 份 独立 
的 数据 副本 ,发 送 方 感知 不 到 接收 方 对 副本 所 做 的 任何 操作 。 癌 发 送 方 回 传 信息 的 唯一 途径 就 是 
反问 发 送 男 一 条 消 奶 。 由 此 而 得 出 的 一 个 重要 结论 是 , 无 论 收发 双方 是 喘 处 同一 台 机 器 上 还 是 被 
网 络 所 隔离 ， 它 们 都 能 以 相同 的 方式 进行 通信 。 

消息 传递 一 般 可 分 为 两 类 : 同步 方式 和 措 步 方式 。 在 同步 方式 下 ， 消 息 抵 达 接 收 端 之 前 发 送 
方 什么 事 也 做 不 了 ; 在 异步 方式 下 ， 消 息 一 经 投递 发 送 方便 可 立即 着 手 于 其 他 事务 。( 在 现实 世 
界 中 ， 机 融 间 的 同步 通信 要 求 接收 方 给 发 送 方 回 复 一 个 确认 ， 以 告知 一 切 OK， 不 过 这 些 细节 对 
程序 员 而 言 可 以 是 透明 的 。”) 
















































































G@) 这 里 的 E 语 言 指 的 是 一 种 基于 JVM 的 并 发 语言 ， 和 汉语 编程 的 “ 易 语 言 ” 不 是 一 个 东西 。 一 一 译 者 注 

@) 本 段 中 future 和 promise 所 指 的 是 同一 个 概念 ， 因 此 作者 在 此 混用 。 译 者 注 

(3) 如 果 考 虑 到 收发 进程 的 故障 以 及 数据 链 路 的 故障 ,那么 这 些 细节 就 无 法 对 程序 员 透 明 。 消 息 必 然 会 有 丢失 或 重复 
的 概率 ; 一 旦 透明 化 ， 应 用 层 必 然 要 面临 因 消 息 丢 失 而 造成 的 无 限 等 待 以 及 消息 重复 的 风险 。 事 实 上 两 点 之 间 能 
保证 消息 既 不 丢失 也 不 重复 的 容错 消息 传递 协议 是 不 存在 的 ， 最 多 是 通过 时 间 戳 、 超 时 、 重 传 来 实现 以 消息 重复 
为 代价 避免 消息 丢失 的 协议 。 在 这 点 上 即便 是 TCP 也 不 例外 。 实 践 中 我 们 能 够 做 到 的 就 是 尽量 减 小 丢失 和 重复 的 
概率 ， 同 时 减 小 这 些 错误 发 生 时 对 应 用 造成 的 代价 。 详 情 可 参见 D. Belsnes 发 表 于 1976 年 的 Single Message 
Communication 以 及 Henry Robinson 的 博文 : Consensus with lossy links: Establishing a TCP connection 
( http://the-paper-trail.org/blog/?p=110 )。 一 -一 译 者 注 
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同步 很 容易 用 寞 步 实 现 ， 令 接收 方 总 是 癌 发 送 方 回 传 一 个 显 式 的 回复 即 可 。 因 此 ，Erlang 中 
的 消 朋 传递 原 语 是 异步 的 。 不 过 , 发送 方 肖 弟 并 不 关心 清明 是 否 抵 达 一 一 消 且 抵达 与 否 其 实 没 那 
么 重要 ， 因 为 你 无 法 预知 接收 方 接 下 来 会 怎样 : 说 不 定 它 旋即 就 挂 近 了 。 这 种 异步 的 “ 即 发 即 桩 
告 ” 式 的 通信 方法 也 意味 春 发 送 方 在 消息 投递 过 程 中 无 须 挂 起 ( 特别 是 在 慢 速 通信 和 链 路 上 发 送 消 
尽 时 )。 

当然 ， 收 发 双方 在 这 一 层面 的 隔离 并 不 是 免费 的 。 复 制 大 型 数据 结构 时 成 本 很 高 ， 如 打发 送 
方 还 要 保留 数据 副本 ， 势 必 造 成 较 高 的 内 存 消 耗 。 在 实践 中 , 这 意味 着 你 必须 在 发 送 消息 时 小 心 
掌控 消 肯 的 大 小 和 复杂 上 度 。 不 过 一 般 来 说 ， 地 道 的 Erlang 程 序 用 到 的 大 部 分 消息 虱 比 较 小 ， 复 制 
开销 通 肖 可 以 忽略 。 

我 们 硕 望 以 上 论述 能 有 助 于 你 理解 Erlang 在 当今 并 发 编程 领域 中 所 处 的 位 置 。 消 县 传递 可 能 
并 不 是 其 中 最 炫 的 技术 ,但 就 Erlang 的 发 展 历 史 来 看 ， 从 系统 工程 角度 出 发 ， 只 有 它 最 务实 、 最 
灵活 。 












































1.1.4 用 Erlang 进 程 编程 


开发 Erlang 程 序 时 ， 你 得 问 问 目 己 :“ 在 我 要 解决 的 问题 中 哪些 活动 是 并 发 的 一 一 或 者 说 哪 
些 活动 可 以 彼此 相互 独立 地 进行 ? ”简要 回答 这 个 问题 后 ， 你 便 可 以 开始 搭建 系统 了 ， 你 找 出 来 
的 那些 并 发 活动 的 每 个 实例 都 应 该 是 系统 中 的 一 个 独立 的 进程 。 

与 大 多 数 语言 相反 ，Erlang 中 的 并 发 很 廉价 。 拍 生 一 个 进程 跟 你 在 普通 面 癌 对 象 语言 中 分 配 
一 个 对 象 的 开销 差不多 。 你 可 能 得 先 好 好 适应 一 下 , 这 个 理念 可 真是 闻所未闻 ! 但 等 你 适应 之 后 ， 
魔术 便 开 始 上 演 。 摘 绘 一 组 复杂 运算 ， 将 之 切 分 为 奋 干 并 发 部 件 ， 再 全 部 建 模 为 独立 的 进程 。 局 
动 运算 、 派 生 进程 、 人 处 理 数 据 ， 在 输出 结果 后 的 那 一 瞬间 ， 所 有 进程 神奇 地 烟消云散 ,它们 的 内 
部 状态 、 它 们 持 有 的 数据 库 句 柄 、 它 们 打开 的 套 接 字 ， 以 及 一 切 你 不 乐意 手工 清理 的 东西 ， 都 一 
并 消失 得 无 影 无 踪 。 

在 这 一 节余 下 的 内 容 中 , 我 们 将 简要 地 看 看 进程 是 多 么 易于 创建 、 多 么 轻 量 ,它们 之 间 的 通 
信 又 是 多 人 么 简单 。 

1. 创建 进程 : 派生 

Erlang 进 程 不 是 操作 系统 线程 。 它 们 由 Erlang 运 行 时 系统 实现 ， 比 线程 要 轻 量 得 多 ， 运 行 在 
商用 硬件 上 的 单个 Erlang 系 统 可 以 轻易 派生 出 成 百 上 千 个 进程 。 运 行 时 系统 中 所 有 进程 之 间 相 互 
隔离 ; 单个 进程 的 内 存 不 与 其 他 进程 共享 ， 也 不 会 被 其 他 濒 死 或 跑 狗 的 进程 破坏 。 

在 现代 操作 系统 中 ,典型 的 线程 会 在 地 址 空间 中 为 自己 预 留 数 兆 的 栈 空间 (也 就 是 说 32 位 的 
机 需 上 并 发 线程 数 最 多 也 就 几 千 个 ), 栈 空间 溢出 便 会 导致 朋 尝 。 为 一 方面 ,Erlang 进程 在 启动 时 
栈 空间 只 需要 几 百 字 闻 ， 并 且 会 目 动 按 需 伸缩 。 

Erlang 创 建 进程 的 语法 很 直接 ,如 下 所 示 。 让 我 们 来 派生 一 个 执行 io: format ("erlang!") 
后 立即 退出 的 进程 : 


spawn (1o, format, ["erlang!"],) 
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这 就 行 了 。( spawn 函 数 有 若干 个 变 体 , 这 是 其 中 最 简单 一 个 。) 这 段 代 码 启动 一 个 独立 进程 , 在 1 
终端 上 打印 文本 “erlang!” 后 退出 。 

我 们 将 在 第 2 章 给 出 Erlang 语 言及 其 语法 的 综述 , 但 现在 , 在 进一步 阐述 之 前 我 们 希望 你 能 自 
行 抓 住 示例 代码 的 要 点 。Erlang 的 一 大 优点 便 是 即便 从 来 没 见 过 这 种 语言 ， 也 能 相对 容易 地 读 懂 
代码 ?。 不 妨 试 试看 吧 。 

2. 进程 之 间 怎 么 打交道 

进程 被 派生 并 运行 起 来 后 还 有 别 的 事情 要 做 一 它们 要 进行 信息 交换 。Erlang 让 通信 变 得 简 
单 。 用 于 消息 发 送 的 基本 运算 符 是 !, 读 作 “bang”， 用 法 是 “目的 地 ! 消 息 ”。 这 就 是 最 简单 的 消 
息 传递 ， 就 像 寄 明信片 一 样 。OTP 框 架 将 进程 间 通信 提升 到 了 另 一 个 层面 ， 我 们 将 在 第 3 章 对 此 
做 深入 探讨 。 现 在 ， 让 我 们 来 看 看 两 个 独立 的 并 发 进程 间 的 通信 ，Erlang 简 单 的 通信 机 制 一 定 会 
今 你 惊叹 不 已 ， 详 情 参 见 代 码 清 单 1-1: 


代码 清单 1-1 ”Erlang 进程 间 通 信 


run({)} -> 
































Pid = spawn (fun ping/0), 


Pid ! self'(), 

receive 
Pong -> ok 

End. 

ping() -> 

recelve -0 From 中 包含 发 送 方 ID 
From -> From 上 pong 

GT 


化 上 一 两 分 钟 看 看 这 段 代码 , 相信 和 即便 从 未 接触 过 Erlang 你 也 能 看 虱 。 稍微 需要 注意 的 地 方 : 
调用 了 spawn 的 一 个 变 体 ， 参 数 是 一 个 函数 引用 ， 该 函数 “名 为 ping、 参 数 数 日 为 零 "; 再 就 是 
图 数 self ()， 它 返回 当前 进程 的 标识 符 ， 用 于 告知 新 进程 该 把 消息 回复 给 谁 @。 

这 便 是 Erlang 进 程 通信 的 概况 。 每 调用 spawn 一 次 都 会 得 到 一 个 新 的 进程 标识 符 ， 用 于 唯一 
标识 新 创建 的 子 进 程 。 这 个 标识 符 后 续 可 用 于 向 子 进程 发 送 消息 。 每 个 进程 部 有 一 个 信箱 ， 无论 
进程 繁忙 与 否 ,都 会 完 把 外 来 的 消息 存放 在 这 儿 , 直到 进程 下 次 检查 信箱 前 所 有 消息 都 寄存 于 此 。 
随后 进程 会 在 日 己 所 意 的 时 候 用 receive 表 达 式 从 信箱 中 分 检 和 读 取 消 晨 ,如 同 示例 所 示 ( 此 处 
是 取 走 第 一 条 就 绪 的 消息 )。 

3. 进程 的 终止 

进程 完工 后 , 便 会 消失 。 它 的 工作 内 存 、 信 箱 和 其 他 资源 都 会 补 回 收 。 该 进程 右 是 用 作 其 他 
进程 的 数据 源 ， 那 么 它 必 须 在 终止 前 显 式 地 将 数据 以 消息 的 形式 投递 出 去 。 

月 演 ( 异常 ) 造成 进程 意外 提前 终止 , 一 旦 发 生 骨 演 ， 其 他 进程 会 得 到 通知 。 之 前 我 们 曾 说 
过 进程 之 间 相 互 独立 , 单个 进程 的 月 尝 不 会 破坏 其 他 进程 ,因为 它们 互 不 共享 内 部 状态 。 这 构成 
了 Erlang 另 一 主要 特性 的 一 个 文 柱 ， 该 特性 就 是 : 容错 。 我 们 将 在 下 一 节 做 话 细 论述 。 























QD 这 个 …… 真 的 是 不 敢 苟 同 哇 。 一 一 译 者 注 


图 灵 社 区 会 员 for(;;)(13433955876@163.com) 专 享 尊重 版 权 


10 第 1] 章 ，Erlang/OTP 平台 


1.2 Erlang 的 容错 架构 


在 现实 世界 中 容错 就 是 真 金 白 银 。 程序 员 并 不 完美 , 需求 往往 也 不 完善 。 正 如 航空 工程 师 处 
理 有 缺陷 的 钢材 和 铝 材 一 样 , 为 了 有 效 处 理 有 缺陷 的 代码 和 数据 ， 我 们 需要 能 够 容错 的 系统 ， 以 
防 系统 在 遭遇 突 发 状况 时 土崩瓦解 。 

和 许多 其 他 编程 语言 一 样 ，Erlang 也 具备 异常 处 理 机 制 来 捕获 特定 代码 段 的 错误 ， 不 过 它 还 
有 一 套 独 一 无 二 的 可 以 有 效 处 理 进程 故障 的 进程 链接 系统 ， 我 们 即将 在 此 进行 讨论 。 











1.2.1 进程 链接 如 何 工作 


Erlang 进 程 意外 退出 时 ， 会 产生 一 个 退出 信号 。 所 有 与 濒 死 进程 链接 的 进程 都 会 收 到 这 个 信 
号 。 坎 认 情 次 下 ,接收 方 会 一 并 退出 并 将 信号 传播 给 与 它 链接 的 其 他 进程 ， 直到 所 有 和 直接 或 间接 
链接 在 一 起 的 进程 统统 退出 为 止 (参见 图 1-2 )。 这 种 级 联 行为 可 以 使 一 组 进程 像 单个 应 用 一 样 退 
出 ， 因 此 系统 整体 重启 时 你 不 必 担 心 是 否 还 有 残存 下 来 未 能 完全 关闭 的 进程 。 


这 旨 
2、 x 
2 
图 1-2 ”崩溃 进程 发 出 的 退出 信号 被 传播 到 所 有 与 之 链接 的 进程 ， 一 般 情况 下 它们 会 共 
同 退出 ， 以 便 完成 对 整个 进程 组 的 清理 工作 
前 面 我 们 曾 提 到 过 利用 进程 来 清理 复杂 状态 。 其 基本 原理 是 : 每 个 进程 完整 封装 自己 的 全 部 
状态 ,因此 进程 退出 时 系统 的 其 余部 分 不 会 受 损 。 如 同 单个 进程 一 样 ,这 一 点 对 相互 链接 的 进程 
组 也 同样 适用 。 一 个 进程 崩溃 ,与 之 协作 的 其 他 进程 也 一 并 退出 ,如 此 便 可 干净 利落 地 抹 掉 之 前 
建立 的 所 有 复杂 状态 ， 既 节省 了 程序 员 的 时 间 也 减少 了 错误 。 




















鼓励 朋 演 
当 你 还 在 绝望 地 纠结 于 如 何 挽回 那些 你 可 能 根本 无 能 为 力 的 局 面 时 ，Erlang 的 哲学 却 是 
“鼓励 前 溃 ” 一 一 精确 记录 下 事 发 位 置 和 经 过 后 ， 把 一 切 彻 底 抛 下 重新 再 来 。 这 不 太 常 见 ， 但 


的 确 是 一 条 强大 的 容错 秘诀 ， 而 且 按 这 个 思路 建立 起 来 的 系统 无 论 多 复杂 都 可 调试 。 


1.2.2 ”监督 与 退出 信号 捕捉 


OTP 实 现 容错 的 主要 途径 之 一 束 是 改写 退出 信号 默认 的 传播 行为 ,通过 设置 trap_exit 进 程 
标记 , 你 可 以 令 进 程 不 再 服从 外 来 的 退出 信号 , 而 是 将 之 捕捉 。 这 种 情况 下 , 进程 接收 到 信号 后 ， 
会 先 将 其 转 为 一 条 格式 为 {' EXIT' ，Pid，Reason} 的 消息 ， 该 消息 描述 了 哪个 进程 出 于 什么 原 
因而 发 生 故 障 , 然后 这 条 消息 会 像 普通 消息 一 样 被 和 入 信箱 , 捕捉 到 信号 的 进程 就 能 分 检 并 人 处理 
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这 关 消 县 了 。 

这 类 会 捕捉 信号 的 进程 有 时 被 称 为 系统 进程 ， 它 们 执行 的 代码 往往 有 别 于 普通 的 工作 进程 
( 即 通 第 不 捕捉 信号 的 进程 ),。 号 为 防范 退出 信号 进一步 传播 的 壁垒 ， 系统 进程 阻 断 了 与 之 链接 的 
其 他 进程 和 外 界 之 间 的 联系 ， 因 而 可 用 于 汇报 故障 力 至 重启 故障 的 子 系统 ， 正 如 图 1-3 所 示 。 我 
们 将 这 类 进程 称 为 监督 者 。 























图 1-3 监督 者 、 工 作者 和 信号 : 某 工 作 进程 的 骨 溃 被 级 联 传播 至 所 有 与 之 链接 的 其 他 
进程 ， 信 号 传播 至 监督 者 后 ， 监 督 者 将 进程 组 重启。 同一 监督 者 辖区 内 的 其 他 
进程 组 则 不 受 影响 


停止 并 重 局 整个 子 系统 的 目的 在 于 将 系统 恢复 到 一 个 已 知 的 可 正常 工作 的 状态 。 这 有 点 类 似 
于 重 局 电脑 : 通过 重 局 你 可 以 快刀 斩 乱 抹 地 将 电脑 迅速 恢复 到 可 工作 状态 。 但 重 局 整 台电 脑 的 问 
题 在 于 粒度 太 大 。 理 想 状 次 下 ， 应 该 可 以 只 重 局 系统 的 一 部 分 ， 粒 度 越 小 越 好 。Erlang 的 进程 链 
接 与 监督 者 共同 提供 了 一 种 细 粒 度 的 “ 重 忆 ”机制 。 

不 过 , 如 琳 就 到 此 为 止 , 你 还 是 得 目 己 从 头 实现 监督 机 制 , 这 需要 绩 密 的 思考 和 丰 曙 的 经 验 ， 
bug 的 清除 和 各 种 边界 情况 的 处 理 也 要 花费 大 量 的 时 间 。 季 运 的 是 ，OTP 和 框架 提供 了 你 所 需要 的 
一 切 : 既 有 运用 监督 机 制 来 构建 应 用 程序 的 一 套 方 法 ， 也 有 稳定 的 、 经 过 实战 考验 的 基础 库 。 

OTP 人 允许 监督 者 按 预 设 的 方式 和 次 序 来 局 动 进程。 我 们 还 可 以 告知 监督 者 如 何在 单个 进程 故 
障 时 重启 其 他 进程 、 一 段 时 间 内 尝试 重启 多 少 次 后 放弃 重启 等 。 你 所 要 做 的 就 是 提供 一 些 参 数 和 
回调 。 
































图 灵 社 区 会 员 for(;;)(13433955876@163.com) 专 享 尊重 版 权 


12 第 1] 章 ，Erlang/OTP 平台 








然而 系统 不 应 该 只 允许 一 层 监督 者 工作 者 结构 。 在 任何 复杂 系统 中 , 你 都 可 以 用 多 层 的 监督 
树 在 多 个 层级 重 局 子 系统 来 解决 各 种 意外 问题 。 





1.2.3 ”进程 的 分 层 容错 


通过 分 层 可 以 将 相关 的 子 系统 归于 同一 个 监督 者 的 辖区 之 内 。 更 重要 的 是 , 这 样 做 可 以 定义 
多 个 层级 的 基准 工作 状态 ， 随 时 供 你 重 置 。 在 图 1-4 中 ， 你 可 以 看 到 两 个 分 别 受 独立 监督 进程 监 
督 的 工作 进程 组 A 和 B。 这 两 个 组 和 它们 的 监督 者 共同 形成 了 一 个 更 大 的 进程 组 C, 并 由 例 中 更 高 
层 的 一 个 监督 者 负责 。 




















图 1-4 一 个 分 层 的 监督 者 工作 者 系统 。 如 果 出 于 某 种 原因 监督 者 A 崩 江 或 退出 ， 它 辖 
区 内 所 有 尚 还 存活 的 进程 都 会 被 强制 关 财 ， 同 时 C 会 收 到 通知 ， 于 是 进程 树 的 
左 半边 会 被 重启 。 监 督 者 B 则 不 受 影 响 ， 除 非 C 决 定 天 闭 整个 系统 


我 们 假设 A 组 进程 的 任务 是 输出 供 B 组 使 用 的 数据 流 。 无 须 B 组 ，A 组 也 可 正常 工作 。 更 具体 
一 点 ， 比 方 说 A 组 在 处 理 和 编码 多 媒体 数据 ，B 组 则 了 予以 展现 。 我 们 再 假设 A 组 处 理 的 数据 中 有 一 
小 部 分 受 损 ， 且 数据 损坏 的 模式 无 法 在 开发 应 用 时 预测 。 

这 种 畸形 数据 会 导致 A 组 的 进程 工作 异常 。 按 照 改 励 朋 演 的 上 哲学， 进程 不 会 尝试 去 解决 问题 
而 是 直接 月 演 ; 由 于 进程 相互 隔离 ， 其 他 进程 并 不 会 受到 错误 输入 的 影响。 监督 者 检测 到 进程 骨 
尝 后 ， 会 将 A 组 重启 以 回 退 到 预 设 的 基准 状态 ， 从 而 使 整个 系统 恢复 到 一 个 已 知 的 基准 点 。 美 妙 
的 是 号 为 展现 系统 的 B 组 完全 不 知晓 也 不 关心 这 个 过 程 ,只 要 A 组 能 为 B 组 持续 提供 足够 的 优质 数 
据 ， 使 后 者 能 为 用 户 展现 质量 过 关 的 内 容 ， 你 的 系统 就 是 成 功 的 。 

通过 隔离 系统 中 不 相关 的 部 分 并 将 它们 组 织 成 监督 树 , 你 可 以 划分 出 多 个 子 系统 ,每 个 都 可 
独立 地 在 儿 分 之 一 秒 内 完成 重启 , 这样 一 来 , 即便 你 的 系统 碰 上 不 可 预期 的 错误 也 可 以 稳健 地 运 
行 。 在 A 组 无 法 正 背 重启， 它 的 监督 者 最 终 会 放弃 重启 并 将 问题 上 报 至 C 组 的 监督 者 。 在 这 种 情 
况 下 ，C 组 的 监督 者 会 一 并 关闭 B 组 然后 停工 。 想 象 一 下 和 奉 系 统 中 同时 运行 着 儿 百 个 C 这 样 的 子 系 
统 ， 这 就 相当 于 因数 据 错 误 而 丢弃 了 一 个 多 媒体 连接 ， 其 他 连接 仍然 照常 工作 。 

然而 ， 既 然 大 家 都 跑 在 同一 全 机 带 上 ， 就 不 得 不 共用 一 些 东 西 : 内 存 、 便 盘 驱 动 磊 、 网 络 连 
接 , 乃至 处 理 闫 和 所 有 相关 电路 , 还 有 一 样 最 重要 的 , 就 是 从 同一 个 插座 上 接 出 来 的 那 根 电源 线 。 
如 果 这 些 东西 中 有 一 样 发 生 故 障 或 断 开 , 不 管 怎 么 分 层 怎么 做 进程 隔离 都 无 法 避免 宕 机 。 这 就 把 
我 们 市 人 了 下 一 个 主题 , 也 就 是 分 布 式 一 一 能 助 你 实现 最 高 级 别 的 容错 并 令 你 的 解决 方案 伸 顷 日 
如 的 ， 正 是 Erlang 的 这 个 特性 。 
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1.3 分布 式 Erlang 


借助 于 语言 属性 和 基于 复制 的 进程 通信 ，Erlang 程 序 天 然 就 可 以 分 布 到 多 台 计算 机 上 。 要 问 
为 什么 ， 且 让 我 们 来 看 两 个 用 Java 或 C++ 这 类 语言 写成 的 进程 ， 它 们 运作 良好 并 以 共享 内 存 为 通 
信 手 段 。 假 设 你 已 经 搞定 了 锁 的 问题 ,一 切 精准 而 高 效 ,但 就 在 你 试图 将 其 中 一 个 线程 挪 到 另 一 
台 机 器 上 时 ,问题 出 现 了 。 或 许 是 为 了 利用 更 高 效 的 计算 能 力 和 内 存 , 或 许 是 为 了 预防 两 个 线程 
在 硬件 故障 造成 的 宕 机 中 同时 挂 掉 ,无 论 如 何 , 这 一 刻 降临 时 ， 程 序 员 往往 被 迫 重新 设计 代码 结 
构 ， 以 便 配 合 新 的 分 布 式 环境 中 迎 异 的 通信 机 制 。 显然， 这 将 耗费 大 量 的 开发 成 本 ,而 且 很 可 能 
会 引入 数 年 才能 彻底 清除 的 bug。 

Erlang 程 序 却 不 受 这 些 问 题 的 影响 。 正 如 我 们 在 1.1.2 节 所 解释 的 那样 ，Erlang 规 避 了 数据 共 
享 并 通过 复制 进行 通信 ， 这 使 得 Erlang 代 码 可 以 直接 分 布 到 多 台 机 器 上 。 在 命令 式 语言 里 用 线程 
编程 时 ， 各 部 分 代码 往往 会 因数 据 共享 引入 复杂 的 依赖 关系 ; 这 类 问题 在 Erlang 中 则 很 少见 。 今 
天 能 跑 在 你 的 笔记 本 上 ， 明 天 就 能 跑 在 集群 上 。 

Erlang 应 用 通常 可 以 直接 分 布 到 多 个 网 络 节点 上 ， 这 同时 意味 着 伸缩 性 问题 也 简化 为 一 个 数 
量 级 。 你 仍然 需要 考虑 好 各 类 进程 的 职能 ， 每 类 进程 需要 运行 多 少 个 实例 ， 在 哪些 机 器 上 运行 ， 
怎样 均衡 负载 以 及 怎样 管理 数据 ;但 至 少 以 下 这 类 问题 不 用 再 劳 你 费心 了 : “我 到 底 该 怎么 切 分 
现 有 的 程序 才能 搭建 出 元 余 的 分 布 式 系统 ?“,“ 它 们 之 间 该 怎么 通信 ? “， 还 有 “我 该 怎样 得 体 
地 处 理 故障 ? ”。 









































实际 案例 

在 一 个 屋 主 那里 ， 我 们 在 网 络 上 跑 着 多 个 各 式 各 样 的 Erlang 应 用 。 独 立 OTP 应 用 的 类 型 
大 概 有 至 少 15 种 ,它们 协同 完成 菜 个 共同 的 任务 。 做 集成 测试 时 , 我 们 固然 可 以 在 15 个 虚拟 
机 上 测试 这 个 跑 着 15 个 不 同 应 用 的 集群 ， 但 这 绝 非 最 便捷 的 做 法 。 实 际 上 我 们 一 行 代码 也 没 
改 ， 就 在 单个 Erlang 实例 上 启动 了 所 有 应 用 并 完成 了 测试 。 在 那个 节点 上 ， 它 们 使 用 相同 的 
通信 方式 、 相 同 的 语法 ， 就 跟 分 布 在 网 络 中 的 多 个 节点 上 一 模 一 样 。 

这 个 全 例 所 示范 的 概念 称 作 位 置 透 明 性 。 其 基本 含义 是 当 你 用 进程 的 唯一 ID 作为 目标 地 
址 向 进程 发 送 消息 时 , 你 不 用 了 解 甚至 不 用 关心 那个 进程 所 处 的 位 置 一 一 只 要 接收 方 还 “ 活 得 
好 好 的 ”，Erlang 运行 时 系统 便 会 替 你 把 消息 投递 到 它 的 信箱 里 ”。 





现在 你 已 经 大 仅 了 解 Erlang 能 做 些 什 么 了 ， 下 面 我 们 来 讲 讲 位 于 核心 的 引擎 ， 好 让 你 明日 在 
Erlang 程 序 运行 时 究 范 发 生 了 些 什么 。 
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那么 上 述 这 一 切 育 后 的 驱动 力 是 什么 呢 ? 标准 Erlang 实 现 的 核心 是 一 个 称 作 Erlang 运 行 时 系 








J 作者 在 此 处 显然 不 够 严谨 ， 如 果 收 发 双方 吴 处 不 同 机 器 ， 要 投递 成 功 至 少 还 需要 双方 之 间 网 络 畅通 。 一 一 译 者 注 
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统 ( ERTS ) 的 应 用 : 这 是 一 大 块 用 C 语 言 写 成 的 代码 ， 人 负责 Erlang 中 所 有 底层 的 玩意 儿 。 通 过 它 
你 才能 跟 文件 系统 和 终端 打交道 , 它 还 处 理 内 存 , 实现 Erlang 进 程 的 也 是 它 。ERTS 知 道 如 何 将 这 
些 进程 分 布 到 现 有 的 CPU 资 源 上 才能 充分 发 挥 计算 机 硬件 的 能 力 。 同 时 ， 哪 怕 你 只 有 一 个 单 核 
CPU 它 也 能 实现 Erlang 进 程 的 并 发 执行 。ERTS 还 负责 处 理 进程 间 的 消息 传递 ,并 使 处 在 不 同 机 吉 
上 运行 在 各 自 的 ERTS 中 的 进程 能 够 像 身 处 同一 人 台 机 器 上 一 样 进 行 通信 。Erlang 中 所 有 需要 底层 文 
持 的 东西 都 由 ERTS 处 理 ， 所 以 ERTS 移 植 到 哪个 平台 Erlang 就 能 在 哪个 平台 上 跑 。 

ERTS 中 特别 重要 的 一 个 部 分 就 是 Erlang 的 虚拟 机 模拟 顺 : 这 是 执行 Erlang 程 序 经 编译 后 产 出 
的 字 节 码 的 地 方 。 这 个 虚拟 机 也 就 是 Bogdan Erlang 抽 象 机 (BEAM ) “”， 它 非常 高 效 : 虽然 我 们 
也 可 以 将 Erlang 程 序 编译 为 本 地 机 需 码 , 但 一 般 没 有 那个 必要 , 因为 BEAM 模 拟 顺 已 经 够 快 的 了 。 
注意 虚拟 机 和 ERTS 之 间 并 没有 明确 的 界线 ; 通常 人 们 ( 包括 我 们 自己 ) 口中 的 Erlang VM 指 的 就 
是 模拟 器 加 上 运行 时 系统 。 

运行 时 系统 中 有 许多 有 趣 的 特性 ， 奋 不 在 文档 中 挖 地 三 尺 或 是 长 期 浸 泽 于 Erlang 邮 件 列表 ， 
你 是 不 会 知道 的 。 它 们 正 是 Erlang 能 同时 处 理 那 么 多 进程 的 精 要 之 所 在 ， 也 是 Erlang 如 此 特别 的 
原因 之 一 。Erlang 语 言 的 基 本 哲学 加 上 实现 者 所 采取 的 务实 方案 ， 共 同 为 我 们 市 来 了 异常 高 效 、 
面向 生产 的 稳定 系统 。 在 这 一 节 ， 我 们 将 讨论 促成 了 Erlang 的 强大 和 高 效 的 3 个 重要 方面 : 

口 调度 器 一 一 处 理 运 行 中 的 Erlang 进 程 , 令 所 有 就 绪 的 进程 共享 可 用 的 CPU 资源 ， 并 在 新 消 

县 到 达 或 发 生 超 时 的 时 候 唤 醒 相 应 的 睡眠 中 的 进程 ; 
口 1O 模 型 一 一 防止 系统 在 进程 与 外 部 设备 通信 时 阻塞 ， 令 系统 平稳 运行 ; 






































口 垃圾 回收 器 一 一 回收 不 再 使 用 的 内 存 。 
我 们 从 调度 名 开讲 。 


1.4.1 调度 器 


经 过 多 年 的 演进 ，ERTS 的 进程 调度 器 提供 了 其 他 平台 无 法 比拟 的 灵活 性 。 它 最 初 的 设计 目 
标 是 在 单 CPU 上 并 发 运行 轻 量 级 Erlang 进 程 ， 而 不 用 关心 底层 用 的 是 什么 操作 系统 。ERTS 运 行 的 
时 候 通 党 就 是 单个 操作 系统 进程 ( 在 操作 系统 的 进程 列表 中 一 般 名 为 beam 或 werl )。 这 个 进程 中 ， 
就 跑 着 管理 所 有 Erlang 进 程 的 调度 器 。 

随 着 线程 在 大 多 数 操作 系统 中 的 普及 ，ERTS 也 有 所 变化 ， 开 始 将 MO 系统 这 类 东西 从 运行 
Erlang 进 程 的 线程 中 拿 出 来 ， 放 到 独立 的 线程 中 去 ， 但 完成 主体 工作 的 线程 仍然 只 有 一 个 。 如 果 
你 用 的 是 多 核 系统 , 就 必须 在 同一 台 机 需 上 运行 多 个 ERTS 实 例 。 不 过 从 2006 年 $ 月 起 , Erlang/OTP 
第 11 版 中 增加 了 对 称 多 处 理 硕 〈SMP ) 文 持 。 这 是 一 项 重大 突破 ， 令 Erlang 运 行 时 系统 可 以 在 内 
部 使 用 不 止 一 个 进程 调度 种， 每 个 占用 一 个 独立 的 操作 系统 线程 。 其 效果 参见 图 1-1。 

这 意味 肴 现在 Erlang 进 程 可 以 以 z: m 的 方式 映射 到 操作 系统 线程 。 每 个 调度 益处 理 一 个 进程 
池 。 可 并 行 运行 的 Erlang 进程 最 多 能 有 m 个 ( 每 个 调度 器 线程 执行 一 个 ), 但 同一 池内 的 进程 仍 像 























GD Bogdan 指 的 是 BEAM 的 发 明 人 Bogumil Hausman。BEAM 原 本 叫 作 Turbo Erlang， 后 来 由 于 复杂 的 法 律 问题 更 名 为 
BEAM。 详 情 参 见 4.7 节 。 一 一 译 者 注 
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之 前 所 有 进程 共用 一 个 调度 需 那样 分 时 运行 。 在 此 基础 之 上 , 进程 可 以 在 进程 池 之 则 迁移 以 便 维 

所 可 用 调度 名 上 的 负载 均衡 。 在 最 新 的 Erlang/OTP 发 布 版 中 ， 甚 至 可 以 根据 机 带 上 CPU 的 拓扑 情 
况 将 进程 绑 定 到 特定 的 调度 和希 上 ， 从 而 更 好 地 利用 便 件 的 绥 存 钠 构 。 这 意味 看 ， 大 多 数 时候 , 作 
为 一 名 Erlang 程 序 员 你 不 用 担心 手头 有 多 少 CPU 或 有 多 少 个 核 : 你 只 要 中 规 中 和 抢 地 写 程序 ， 并 尽 
量 将 程序 切 分 为 尺寸 适中 的 并 行 任务 就 好 ,负载 均衡 之 类 的 事情 就 让 Erlang 运 行 时 系统 去 操心 吧 。 
不 管 是 单 核 还 是 128 核 一 一 者 一样， 只 会 更 快 。 

Erlang 新 手 向 犯 的 一 个 钳 误 就 是 过 分 依赖 时 序 ， 这 往往 导致 那些 在 他 们 的 笔记 本 或 工作 站 上 
运行 良好 的 程序 一 迁移 到 多 核 服 务 瘟 上 就 出 错 ， 因 为 在 多 核 服务 侣 上 时 序 的 不 确定 性 要 大 得 多 。 
要 发 现 这 类 问题 ,只 能 借助 测试 。 好 在 现在 的 笔记 本 基本 上 都 至 少 是 双核 的 了 , 这 类 错误 也 可 以 被 
尽早 发 现 。 

Erlang 的 调度 右 还 涉及 运行 时 系统 的 为 一 个 重要 特性 :1O 子 系统 ,这 正 是 我 们 的 下 一 个 主题 。 






































1.4.2 1/0 与 调度 


很 多 并 发 语言 郡 有 的 一 个 毛病 束 是 它们 没 脏 么 拿 WO 当 回 事 儿 。 单 个 进程 进行 WO 时 ， 它 们 刀 
乎 都 存在 整个 系统 或 大 半 系 统 阻 紧 的 问题 。 这 真 古 既 恼 人 又 没有 必要 ， 尤 其 是 Erlang 早 在 二 十 年 
前 就 已 经 解决 了 这 个 问题 。 在 前 一 三 ， 我 们 兽 讨 论 过 Erlang 的 进程 调度 带 。 除 了 处理 进程 调度 ， 
调度 带 还 蔡 系 统 优雅 地 处 理 了 LO 问题 。 在 系统 的 最 抵 层 ，Erlang 以 事件 驱动 的 方式 处 理 所 有 1/O， 
当 数 据 进 出 系统 时 ,程序 可 以 以 非 阻 塞 方式 完成 数据 人 处理 。 这 降低 了 连接 建立 和 汤 开 的 频次 ,还 
避 亿 了 OS 层面 上 的 加 贫 开 销 和 上 下 文 切换 。 

这 是 一 种 高 效 的 IO 处 理 方 法 。 可 惜 ， 程 序 员 往往 难以 分 析 和 理解 这 种 技术 ， 这 也 是 为 什么 
只 有 在 明确 要 求 蜗 可 靠 性 和 低 延 人 运 的 系统 中 才能 见 到 这 种 技术 。 早 在 2001 年 ，Dan Kegel 束 在 他 
的 论文 The C10K Problem 中 描述 过 这 个 问题 ,虽然 现在 已 经 略 显 过 时 ,但 这 篇 文章 仍然 很 值得 一 
读 。 它 针对 这 个 问题 及 可 能 的 解决 方案 给 出 了 展 好 的 综述 ,这 些 方案 实现 起 来 全 部 既 复 杂 又 痛 盏 ， 
这 正 是 Erlang 运 行 时 系统 符 你 包办 这 些 问 题 的 原因 。Erlang 在 进程 调度 带 中 整合 了 基于 事件 的 IO 
系统 。 事 实 上 ， 你 一 点 儿 都 不 用 操心 就 能 享受 一 切 便利 。 这 让 用 Erlang/OTP 构 建 高 可 对 性 系统 变 
得 轻松 了 很 多 。 

我 们 要 讲解 的 最 后 一 个 ERTS 特 性 就 是 内 存 管 理 。 它 对 进程 所 起 的 作用 超出 你 的 想象 。 






































1.4.3 ”进程 隔离 与 垃圾 回收 器 


如 你 所 想 ，Erlang 跟 Java 等 大 部 分 现代 语言 一 样 ， 会 目 动 管理 内 存 。 这 儿 没 有 显 式 的 释放 操 
作 。 相 反 ， 垃 圾 回收 器 会 定期 搜寻 和 回收 不 再 使 用 的 内 存 。 垃 圾 回收 (GC ) 算法 是 一 片 广 认 而 
复杂 的 人 研究 领域 , 我 们 无 法 在 这 儿 给 出 详尽 的 阐述 ; 不 过 针对 那些 对 此 有 一 定 了 解 又 心怀 好 奇 的 
读者 ， 可 以 告诉 你 Erlang 当 前 使 用 的 是 一 个 简单 明了 的 分 代 复制 式 垃圾 回收 各 。 

虽然 实现 相对 价 单 ,Erlang 程 序 却 不 太 会 像 其 他 语言 开发 的 系统 那样 在 GC 时 遭受 俘 顿 。 这 主 
要 因为 Erlang 进 程 之 间 的 隔离 : 每 个 进程 所 使 用 的 内 存 都 是 目 己 的 ， 随 进程 的 创建 和 结束 而 分 配 
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和 释放 。 听 起 来 好 像 没什么 要 紧 ， 实 则 不 然 。 首 先 ， 这 意味 着 垃圾 回收 需 可 以 在 不 影响 其 他 进程 
运行 的 前 提 下 单独 暂停 目标 进程 。 其次, 单个 进程 占用 的 内 存 通常 较 小 , 遍历 可 以 快速 完成 。( 也 
有 内 存 占 用 量 大 的 进程 ， 但 这 些 进程 一 般 不 用 做 出 快速 啊 应 。) 再 次 ， 调 度 需 知道 每 个 进程 最 后 
一 次 运行 的 时 间 ， 如 果 某 个 进程 自 上 次 垃圾 回收 后 什么 也 没 干 ,调度 需 会 跳 过 它 。 正 是 这 些 因素 
让 Erlang 既 可 以 轻松 使 用 垃圾 回收 器 ， 又 可 以 保证 较 短 的 停顿 时 间 。 除 此 以 外 ， 有 时 候 进 程 自 派 
生 到 完工 ， 再 到 退出 ， 根 本 就 没有 触发 过 垃圾 回收 。 这 种 情况 下 ,进程 的 作用 相当 于 一 块 县 花 一 
现 的 内 存 ， 除 自动 分 配 和 释放 外 ， 没 有 任何 额外 的 开销 。 

本 市 所 描述 的 运行 时 系统 的 特性 使 Erlang 程 序 能 够 充分 利用 可 用 的 CPU 来 运行 大 量 进程 、 执 
行 JO 操 作 ， 并 自动 回收 内 存 ， 与 此 同时 还 能 维持 软 实时 响应 能 力 。 了 解 了 平台 这 些 方面 的 知识 ， 
便 可 更 好 地 理解 自己 的 系统 自 局 动 后 的 各 种 行为 。 

最 后 ， 在 这 一 章 结束 前 ， 我 们 还 要 说 一 说 Erlang 中 的 函数 式 编程 。 不 会 太 罗 嗪 ， 因 为 我 们 还 
会 在 下 一 草 详 细 探 讨 Erlang 场 言 。 


1.5 ”函数 式 编程 :Erlang 的 处 世 之 道 


对 本 书 的 许多 读者 而 言 ， 函 数 式 编程 可 能 还 是 个 新 概念 。 对 为 一 些 人 来 说 则 不 是 。 捕 数 式 编 
程 绝 对 算 不 上 Erlang 的 决定 性 特征 一 一 并 发 才 是 一 一 但 它 仍 是 该 语言 的 一 个 重要 方面 。 近 年 来 越 
来 越 多 的 人 意识 到 ， 函 数 式 编程 及 其 背后 的 观念 天 然 适 用 于 并 发 与 分 布 式 编程 问题 。( 单 提 一 下 
Google MapReduce 束 够 了 吧 ? ) 

要 对 冰 数 式 编程 做 一 个 总 结 的话 ， 其 主要 思想 就 是 将 孔 数 看 作 和 和 整数、 字符 串 一 样 的 数据 ; 
运用 孔 数 调用 而 非 while 或 for 这 样 的 循环 结构 来 表达 算法 ; 以 及 不 修改 变量 和 值 ( 参见 附录 B 中 
对 引用 透明 性 和 列表 的 讨论 )。 这 些 看 似 人 为 设置 的 约束 ， 从 工程 角度 来 看 却 具 有 非凡 的 意义 ， 
Erlang 程 序 本 里 也 因此 极为 自然 而 可 读 。 

Erlang 并 不 是 一 门 “ 纯 粹 ”的 函数 式 语 言 一 一 它 仍 仰 仗 副作用 。 但 仅 限 于 一 个 操作 : 复制 式 
消息 传递 "。 每 条 消息 都 会 对 外 界 产生 影响 ， 同 时 外 界 也 通过 向 进程 发 消息 来 影响 它们 。 但 每 个 
进程 本 吴 运 行 的 基本 上 都 是 纯 函 数 式 的 程序 。 遵 循 这 个 模型 的 程序 比 C++ 和 Java 这 类 传统 语言 写 
成 的 程序 更 易于 分 析 ， 同 时 又 不 至 于 像 Haskel] 那 样 迫使 你 在 程序 中 使 用 monad。 

在 下 一 和 草 ， 我 们 会 介绍 Erlang 编 程 语言 中 的 关键 部 分 。 佑 计 不 少 谈 者 会 党 得 这 个 语法 很 别 
扭 一 一 它 主 要 倩 鉴 目 Prolog 而 非 C。 虽 然 异 于 篆 规 ， 它 却 并 不 复杂 。 候 上 一 段 时 间 ， 它 就 会 成 为 
你 的 第 二 天 性 。 待 见 悉 之 后 ， 你 便 能 够 看 明日 大 部 分 Erlang 内 核 模 块 的 代码 了 ， 这 才 是 真 刀 真 枪 
的 语法 测试 : 看 看 你 最 后 能 否 看 得 民 ? 


1.6 ”小结 
本 草 我 们 介绍 了 Erlang/OTP 平 台中 身 为 OTP 基 石 的 最 关键 的 概念 和 特性 : 用 进程 和 消息 传递 






















































































J 这 点 也 是 不 准确 的 ，Erlang 中 的 进程 派生 、 针 对 进程 字典 的 操作 以 及 各 种 VO 操作 都 依赖 于 副作用 。 一 一 译 者 注 
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进行 并 发 编程 、 通 过 链接 来 容错 、 分 布 式 编程 、Erlang 运 行 时 系统 和 虚拟 机 ， 还 有 Erlang 核 心 的 
哨 数 式 语 言 。 这 一 切 共同 构成 了 一 个 稳固 、 高 效 、 灵 活 的 平台 ， 让 你 得 以 构筑 可 徘 、 低 延迟 、 高 
度 可 用 的 系统 。 

如 果 你 兽 有 过 Erlang 相 关 的 经 验 , 这 些 内 容 大 部 分 都 不 新 鲜 , 但 希望 我 们 的 讲解 还 算 有 意思 ， 
至 少 能 让 你 看 到 一 些 先 前 未 曾 留 意 的 方面 。 目 前 为 止 , 我们 还 没 怎么 讨论 OTP 框 狠 。 我 们 把 这 部 
分 内 容 放 在 第 3 草 , 不 过 届时 进度 会 比较 快 ， 所 以 趁 现 在 好 好 回味 一 下 这 些 背 景 材料 吧 。 接 下 来 ， 
第 2 革 会 针对 Erlang 编 程 语言 做 一 个 完整 的 综述 。 
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本 章 概要 

口 与 Erlang shell 交 互 

口 数据 类 型 、 模 块 、 卫 数 与 代码 编 译 
口 单 赋值 变量 与 模式 匹配 

口 Erlang 语 言 生 存 指 丙 

口 如 何 运用 递归 来 编程 





在 上 一 章 ,， 我 们 讨论 了 Erlang 和 OTP 的 底层 平台 , 却 没 太 关 注 Erlang 语 言 。Erlang 本 喘 不 是 本 
书 的 重点 , 但 在 你 开始 运用 Erlang/OTP 的 设计 模式 编程 之 前 , 我 们 还 是 需要 先 介绍 一 下 语言 基础 ， 
以 确保 所 有 读者 都 能 站 到 一 条 起 跑 线 上 。 本 昔 还 可 用 作 参 考 手 册 ， 供 你 通读 本 书 时 查阅 。 

这 一 半 很 长 ， 学 过 Erlang 的 读者 可 以 快速 市 过 ， 不 过 我 们 也 为 这 类 读者 精心 挑选 了 一 些 有 用 
的 内 容 。 这 里 罗列 的 都 是 我 们 党 得 每 个 Erlang 程 序 员 都 应 了 解 的 内 容 ， 何 况 即 便 是 经 验 最 老 到 的 
老手 往往 也 会 忽略 一 些 重要 的 细 记 。 

如 末 这 是 你 第 一 次 接触 Erlang， 那 么 你 可 以 先 只 阅 谈 本 章 的 一 部 分 内 容 ， 等 以 后 需要 时 再 回 
过 头 来 查阅 。 我 们 希望 这 些 材料 足以 助 你 消化 本 书后 续 的 内 容 。 不 过 在 将 Erlang 用 到 正式 项 目 上 
之 前 ， 你 最 好 还 是 备 上 一 本 更 完整 的 Erlang 编 程 指 凋 。 本 草 的 末尾 列 出 了 一 些 可 供 深 入 阅读 的 材 
料 , 在 这 儿 我 们 没 法 教授 你 通用 的 编程 技术 和 和 当 门 , 只 能 为 你 解释 该 语言 各 组 成 部 分 的 工作 原理 。 
不 过 我 们 安排 了 一 个 针对 Erlang shell 使 用 的 速成 课程 ， 来 教 你 如 何 编 译 和 运行 自己 的 程序 ， 并 助 
你 擎 握 递 归 。 

为 了 更 好 地 掌握 本 和 草 的 内 容 ， 你 应 该 在 电脑 上 安 竣 一 套 可 运行 的 Erlang。 如 采 你 用 的 操作 系 
统 是 Windows， 请 在 浏览 硕 中 访问 www.erlang.org/download.htm1， 从 Windows Binary 一 栏 最 上 方 
下 载 并 运行 最 新 版 本 的 安装 包 。 关 于 在 其 他 操作 系统 上 安装 Erlang 的 步 怠 ， 参 见 附录 A。 

本 章 中 , 我 们 会 先 过 一 届 Erlang 的 基本 数据 类 型 ,接着 讨论 模块 、 函 数 以 及 代码 的 编译 运 行 ， 
青 就 是 变量 和 模式 匹配 ,之 后 ,我 们 将 讨论 函数 子 句 与 保护 式 ( guard ) case 踪 转 .fun 果 数 (Lambda 
表达 式 )、 异 币 、 列 表 速 构 ， 以 及 二 进 制 串 和 位 串 。 最 后 ， 我 们 会 讨论 记录 、 涉 及 预 处 理 硕 的 文 
件 包含 和 宏 、 进 程 操作 和 消息 传递 ， 还 有 ETS 表 。 林 了， 以 一 上段 完 整 的 针对 递归 编程 的 讨论 来 结 
束 全 篇 。 
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好 啤 ， 在 这 一 切 之 前 ， 让 我 们 先 从 Erlang 启 动 后 的 起 点 开始 : shell。 


2.1 Erlang shell 




















相 较 于 日 常 惯用 的 系统 ，Erlang 系 统 是 一 套 更 是 交互 性 的 环境 。 使 用 大 部 分 编程 语言 时 ， 要 
么 把 程序 编译 成 OS 可 执行 文件 后 运行 ,要么 用 解释 各 来 执行 一 堆 脚 本 文件 或 编译 后 的 字 市 码 文 
件 。 无 论 哪 种 情况 ， 都 是 让 程序 一 路 跑 到 结束 或 表演 为 止 , 然后 回 到 操作 系统 环境 中 ， 青 重复 这 
个 过 程 (一 般 是 改 完 代码 后 )。 

Erlang 却 不 是 这 样 ， 它 更 像 是 在 操作 系统 中 运行 看 的 为 一 个 操作 系统 。 昌 然 Erlang 的 启动 速 
度 很 快 ,但 它 并 非 被 设计 用 于 需要 频繁 局 集 的 场合 一 一 它 补 设计 用 于 持续 运行 ,是 为 交互 式 开发 、 
调试 和 升级 而 设计 的 。 理 想 情 况 下 ， 只 有 碰 到 人 硬件 故障 、 操 作 系 统 升 级 之 类 的 情况 才 有 必要 重启 
Erlang。 

与 Erlang 系 统 的 交互 主要 是 在 shell 中 进行 的 。shell 就 是 你 的 指挥 中 心 。 这 儿 是 你 实验 代码 片 
段 运行 效 末 的 实验 室 ; 这 儿 是 你 做 增 量 开发 和 交互 式 调 试 的 工地 ; 这 儿 也 可 以 是 你 操控 线 上 系统 
的 战场 。 为 了 能 让 你 随心 所 欲 地 雪 驭 shell, 我 们 给 出 了 一 些 让 你 边 看 边 实 验 用 的 示例 。 赶 么 把 shell 
局 动 起 来 吧 ! 

















2.1.1 局 动 shell 





我 们 假设 你 已 经 下 载 并 安 狼 了 Erlang/OTP。 如 果 你 用 的 是 Linux、Mac OSX， 或 其 他 类 UNIX 
系统 ， 启 动 一 个 终端 并 运行 erl 命 令 即 可 。 如 果 你 在 用 Windows， 你 应 该 点 击 安装 程序 蔡 你 生成 的 
Erlang 网 标 ， 随 后 会 局 动 名 为 werl 的 程序 , 它 会 打开 一 个 特殊 的 Erlang 终 端 , 这样 做 可 以 避 人 馅 直接 
在 Windows 终 闹 下 交互 式 运行 erl 会 页 到 的 一 些 问题 。 

启动 Erlang 后 你 应 该 会 看 到 如 下 信息 : 


Erlang (BEAM) emulator Vversion 5.6.5 [smp:2] [async-threads:0. 




















Eshell V5.6.5 (abort with ^Q) 
1> 


1> 是 提示 符 。 随 着 你 不 断 地 输入 命令 ， 它 还 会 依次 变 为 2> 等 。 你 可 以 用 上 、 下 方 回 键 或 
Ctrl-P/Ctrl-N 键 上 下 切换 之 前 输入 的 行 。 另 外 还 有 几 个 Emacs 风格 的 快捷 键 , 但 大 部 分 按键 的 行 ， 
都 比较 常规 。 

我 们 还 可 以 用 -noshell 标 志 启 动 Erlang 系 统 ， 像 这 样 ( 在 你 的 操作 系统 命令 行 里 ): 

erl -noshell 
在 这 种 情况 下 , 你 无 法 通过 终端 与 启动 后 的 Erlang 系 统 进行 交互 。 要 执行 批 处 理 任 务 或 要 将 Erlang 
作为 守护 进程 运行 时 可 以 采用 这 个 方法 。 

现在 你 已 经 知道 怎么 启动 shell 了， 我 们 再 来 看 看 你 能 用 它 来 干 些 什么 。 
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2.1.2 ”输入 表达 式 


首先 ,你 在 shell 提 示 符 下 输入 的 并 不 是 什么 命令 ， 而 是 表达 式 ， 两 者 的 区 别 在 于 表达 式 一 害 
会 返回 一 个 求 值 结 果 。 表 达 式 求 值 完毕 后 ，shell 就 会 打印 出 求 值 结果 。shell 会 记 住 这 些 结果 ， 后 
续 可 以 用 v (1) 、v(2) 这 样 的 语法 来 引用 它们 。 比 如 ， 输 入 数值 4 ， 紧 跟 一 个 喘 文 句号 (.)， 下 
回 车 ， 你 将 看 到 : 


Eshell VS5.6.5 (abort with ^G) 
1> 42. 

42 

2> 


殴 下 回 千 后 ，Erlang 会 对 表达 了 式 42 求 值 , 并 打印 求 值 结 来 (数值 42 ), 最 后 给 出 一 个 新 的 提示 
伯 ， 编 写 为 2。 不 过 为 什么 要 在 42 后 面 加 上 一 个 句号 呢 ? 

1. 以 句号 结束 

在 敲 下 回 千 之 前 ， 必 须 用 句点 告诉 shell 表 达 式 已 输入 完 单 。 如 朱 不 输入 句号 就 回 车 ，shell 会 
一 下 提示 你 输入 更 多 字符 ( 提示 符 编 号 不 会 增加 )， 束 像 这 样 : 




















要 是 一 开始 饼 了 句 写 , 不 用 担心 ， 补 上 之 后 敲 回 车 就 行 了 。 可 以 看 到 ， 这 个 简单 的 算术 表达 
陈 的 求 值 结 果 仍 与 预期 相符 。 现 在 ， 我 们 来 试看 取 回 先前 的 求 值 结 








6> 

不 错 ， 不 过 先 别 得 音 ， 我 们 再 给 你 展示 一 个 几乎 所 有 初学 者 都 会 碰壁 的 问题 : 输入 字符 串 ， 
再 原样 输出 。 

2. 输入 市 引号 的 字符 串 

当 你 输入 双 3 引 号 或 单 引号 字符 串 时 ( 现在 先 不 讨论 二 者 的 区 别 ) 有 一 个 特别 值得 注意 的 问 
题 ， 如 条 志 了 结尾 的 引号 就 禹 了 回 车 ，shell 会 把 同样 的 提示 符 册 打印 一 过 并 继续 等 行 更 多 输入 ， 
这 跟 上 一 个 起 记 句 号 的 例子 差不多 。 如 果 碰 到 这 个 情况 ， 可 以 输入 匹配 的 引 写 并 跟 上 一 个 句号 ， 
册 敲 回 车 。 例 如 ， 像 这 样 : 


1> "hello there. 
1]> 


这 里 的 句号 并 不 是 这 个 字符 串 结 束 的 标志 一 一 它 是 
复 过 来 ， 你 需要 加 些 内 容 来 结束 这 个 字符 串 : 

















后 
ld 
站 
贡 
三 


部分。 为 了 让 shell 从 这 个 状态 中 恢 
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> ". 
"hello there.\n" 
2> 


注意 最 终 的 字符 串 中 包含 一 个 句号 和 一 个 换行 符 , 而 这 多 半 不 是 你 想 要 的 结果 。 你 可 以 用 上 
方 问 键 或 Ctrl-P 找 回 那 行 并 重新 编辑 ， 在 正确 的 位 置 插入 遗漏 的 引号 : 

2> "hello there'". 

"hello there" 

3> VI2) . 


"nello there" 
> 


默认 情况 下 shell 会 保存 最 近 20 条 求 值 结果 , 无 论 是 数值 、 字 符 串 还 是 其 他 类 型 的 数据 。 下 面 ， 
我 们 来 仔细 看 看 v(. . . ) 系列 函数 及 其 同类 。 


























2.1.3 shell 函数 


在 Erlang 中 有 一 类 像 v (N) 这 样 的 函数 ， 它 们 只 存在 于 shell 中 。 这 些 shell 函 数 的 名 字 通 常 很 短 
(也 比较 星 深 )。 要 获取 完整 的 shell 国 数 清单 ， 可 以 输入 help() (其 本 身 也 是 一 个 shell 函 数 )。 初 
学 者 会 难以 理解 这 个 清单 ， 所 以 表 2-1 从 头 列 出 了 你 应 该 知道 的 shell 函 数 。 


表 2-1 重要 的 Erlang shell 函 数 








到 数 说 明 
help () 打印 可 用 的 shell 函 数 
nh () 打印 先前 输入 过 的 命令 
Vv (N) 取出 第 N 号 提示 符 对 应 的 计算 结果 
cdlDir) 更 改 当前 目录 (Dir 应 是 双 引 号 字符 串 ) 
1s() 和 1s (Dir) 打印 目录 内 容 
pwd ( ) 打印 工作 目录 (当前 目录 ) 
a 退出 (init:stop() 的 简写 ) 
i () 打印 当前 系统 的 运行 时 信息 
memory () 打印 内 存 使 用 信息 





请 立刻 试 一 坛 ， 比 如 列举 或 更 改 当 前 目录 、 打 印 历史 记录 、 打 印 系统 和 内 存 信息 等 。 将 一 眼 
i () 的 执行 结果 ， 你 可 以 看 到 正如 操作 系统 一 样 ， 你 眼前 的 提示 符 痛 后 还 跑 者 一 大 堆 的 东西 。 

现在 你 已 经 知道 如 何 启动 Erlang 系 统 以 及 如 何 跟 shell 交 互 了 了， 我 们 再 来 看 看 各 种 退出 shell 回 
到 操作 系统 中 去 的 方法 。 








2.1.4 退出 shell 





退出 shell (并 停止 整个 Erlang 系 统 ) 的 方法 有 好 几 种 。 这 些 方法 你 痢 应 该 熟悉 ， 在 管理 和 调 
试 系统 时 它们 各 有 各 的 作用 。 我 们 从 对 系统 最 友好 的 方法 开始 。 


图 灵 社 区 会 员 for(;)(13433955876@163.com) 专 享 尊重 版 权 


22 第 2 章 ，Erlang 语 言 精 要 


1. 调用 g() 或 init:stop() 

最 安全 的 方法 就 是 运行 上 一 市 提 到 过 的 shell 呐 数 q()。 这 是 init :stop() 困 数 的 一 个 简写 形 
式 (你 也 可 以 直接 调用 这 个 限 数 ), 该 函数 以 一 种 可 控 的 方式 关闭 整个 Erlang 系 统 , 它 会 通知 正在 
运行 的 应 用 停止 运行 并 给 它们 预 留 出 啊 应 时 间 。 通常 这 个 过 程 几 秒 内 就 可 以 完成 , 但 线 上 系统 可 
能 需要 花费 更 多 的 时 间 来 完成 各 种 清理 工作 。 

2. BREAK 菜 单 

如 果 急 着 退出 而 运行 的 东西 也 不 重要 ， 在 类 UNIX 系 统 中 你 可 以 按 Ctrl-C 唤 出 底层 的 BREAK 
菜单 ，Windows 下 可 以 在 werl 终 端 下 用 Ctrl-Break 唤 出 该 荣 单 。 它 看 起 来 是 这 样 的 : 


BREAK: {a}bort (cjontinue (P)roc info (LI)nto (1)oadedq 
(vjersion (k}ill (D}b-tables (d}istribution 


其 中 我 们 感 兴 趣 的 选项 是 (a) 退出 系统 ( 便 集 机 )、(c) 返回 shell， 和 (Vv) 打印 当前 运行 的 
Erlang 的 版 本 。 其 他 选项 则 会 打印 出 许多 系统 相关 的 原始 信息 ， 等 你 成 为 Erlang 专 家 后 ， 会 发 现 
这 些 信息 对 调试 很 有 和 用; (k) 还 可 以 让 你 浏览 所 有 Erlang 内 部 活动 乃至 强制 关闭 任何 故障 进程 ， 
前 提 是 你 明确 知 着 目 己 在 做 什么 。 注 意 shell 本 刁 感 知 不 到 BREAK 沫 单 ， 因 此 当 你 用 (c) 返回 shell 
时 ， 还 得 再 按 一 次 回 车 提示 符 才 会 刷新 。 

3. Ctrl-G 

第 三 个 同时 也 是 最 有 用 的 一 个 退出 方法 就 是 用 Ctrl-G 唤 出 用 户 开关 命令 菜单 。 这 人 么 做 会 令 
Erlang 输 出 这 么 一 段 罗 次 的 文字 : 


User switch command 


键入 h 或 ?并 回 车 ， 你 将 看 到 以 下 的 清单 : 





























C [nn] - connect to ]ob 

i [nn] - interrupt job 

k [nnl] - kill job 

] - list all jobs 

s [shelll] - start local shell 
r [node [shell]j] - start remote shell 
el - dquit erlang 

? h - this message 


在 提示 符 --> 下 键入 c 可 以 返回 shell。 键入 a 会 硬 停机 ， 就 跟 BREAK 菜 单 下 的 (a) 一样 一 一 别 
把 这 个 a 跟 shell 函 数 a () 和 弄 混 ! 后 者 对 系统 更 友好 。 另 外 注意 BREAK 菜 单位 居 更 底层 ， 你 可 以 在 
Ctrl-G 菜 单 中 唤 出 BREAK 菜 单 ， 反 之 则 不 行 。 

其 余 选 项 涉及 任务 控制 ,我们 将 在 下 一 节 简 要 介绍 。 


2.1.5 ”任务 控制 基础 
假设 你 正 坐 在 Erlang shell 提 示 符 前 ， 一 不 小 心 瑟 了 些 乱七八糟 的 东西 ， 跑 起 来 怎么 也 琵 不 住 
(或 者 你 等 不 及 它 跑 完 ) 我 们 时 不 时 总 会 干 出 这 种 事 来 。 这 时 你 固然 可 以 用 上 述 儿 种 方法 之 一 去 


关闭 Erlang 系 统 ， 再 重启 ; 但 更 谨慎 、 更 Erlang 化 的 做 法 是 取消 当前 任务 后 重启 一 个 新 任务 (万 
其 是 系统 中 正 运行 着 一 些 不 能 中 断 的 重要 进程 时 )， 从 而 不 对 系统 其 他 方面 造成 任何 影响 。 
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模拟 一 下 这 个 情形 ， 在 Erlang 提 示 符 下 输入 如 下 内 容 ， 加 上 人 句号 并 回 车 : 

timer:sleep (infinity) 
(我 们 觉得 不 用 对 这 段 多 作 解 释 。) 现在 shell 被 锁 死 了 。 要 解决 这 个 问题 ， 你 应 该 和 完 用 Ctrl-G 响 出 
上 一 节 中 介绍 的 用 户 开 关 命 令 人 菜单， 然后 键 人 3j 列 出 当前 的 任务 。 这 时 应 该 只 有 一 个 任务 ， 所 以 
你 会 看 到 : 


User switch command 











-> 3 
]* {shell,start, [inijtl]} 
= 


键入 s〈 在 本 地 系统 上 ) 启动 一 个 新 的 shell 任 务 ， 跟 之 前 用 的 那个 一 样 ， 然 后 再 看 看 任务 
列表 : 
了 
1 {shell,start, [jnitl} 
2* {shell,start,[l]} 
要 连接 到 新 任务 上 ， 你 可 以 明确 输入 c 2。 男 外 由 于 2 号 任务 已 经 被 * 标 记 为 默认 选项 ， 也 可 
只 键入 c: 
EN V5.7.2 (abort with ^G) 
1> 
你 又 回来 了 ! 但 是 等 等 ， 原 来 的 任务 哪儿 去 了 呢 ? 再 键入 Ctrl-G， 列 出 任务 ， 你 会 看 到 它 仍 
日 挂 在 那里 。 我 们 可 以 输入 k 1 来 天 挥 它 ， 人 然后 再 返回 shell 继 续 试 错 : 


User switch command 














--> j 
1 {shell,start, [init]} 
2* {shell,start,[]} 

--> 区 1 

-> j 
2* {shell,start,[]} 

-> Ce 


干 这 类 事情 的 时 候 , 务必 确认 你 关闭 的 是 哪个 任务 , 尤其 是 在 手头 同时 进行 着 多 个 不 同 的 任 
务 的 时 候 。 一 个 进程 被 关闭 后 ， 它 所 有 的 历史 记录 、 先 前 的 求 值 结果 ， 以 及 一 切 与 这 个 shell 任 务 
相关 联 的 东西 都 会 消失 。 等 我 们 在 第 8 章 讨 论 分 布 式 Erlang 和 远程 shell 时 你 还 会 看 到 Ctrl-G 沫 单 的 
更 多 用 法 。 它 简单 而 强大 ， 是 远程 控制 和 在 线 系统 调试 的 利 需 。 

现在 你 应 该 已 经 找到 了 使 用 Erlang 欣 制 侣 的 感 党 ， 该 来 看 看 Erlang 语 言 了 。 


2.2 Erlang 的 数据 类 型 
学 习 任 何 编程 语言 都 必须 了 解 如 何 表示 基本 数据 。Erlang 的 内 置 数据 类 型 催 单 明了 ， 为 数 也 


不 多 ,但 你 可 以 用 它们 干 很 多 事 。 我 们 将 按 以 下 顺序 讲解 这 些 数据 类 型 . 
口 数值 ( 整数 和 浮 点 数 ); 
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二进制 串 / 位 串 

口 原子 ; 

口 元 组 ; 

口 列表 ( 和 字符 串 ); 

口 唯一 标识 符 (pid、 端 口 、 引 用 ); 

口 Fun 郴 数 。 

Erlang 中 的 数据 通常 被 称 作 项 式 〈term )。 阅 读 这 一 节 时 你 可 以 借助 示例 边 试 边 学 。( 回 车 前 
别 忘 了 句号 )。 让 我 们 先 从 最 简单 的 讲 起 。 
2.2.1 ”数值 与 算术 运算 

Erlang 有 两 种 数值 类 型 : 整 型 和 浮 点 型 ( float )。 大 部 分 算术 运算 都 会 自动 进行 类 型 转换 ， 
此 通常 用 不 上 显 式 强制 类 型 转换 ( 详情 参见 下 一 节 )。 

1. 整数 

Erlang 中 的 整数 大 小 没有 限制 "。 较 小 的 整数 会 被 存放 在 单个 机 器 字 长 内 ;处 理 较 大 的 整数 ( 即 
所 谓 的 bignum ) 时 ,会 目 动 按 需 分 配 内 存 。 这 些 对 程序 员 而 言 都 是 完全 透明 的 ,所 以 你 不 必 担 心 
截断 或 溢出 的 问题 一 一 这 些 情况 压根 儿 就 不 会 发 生 。 

一 般 来 说 ， 整 数 的 写法 没什么 特别 的 (不 妨 试 着 输入 一 些 大 整数 看 看 ): 

TO 


-1]101 
1234567890 * 9876543210 * 9999999999 


男 外 ,你 还 能 使 用 从 2 进 制 到 36 进 制 的 整数 (分别 采 用 数 子 0 ~ 9 加 上 字符 A~ Z/a ~z)， 当 然 2 
进 制 、16 进 制 以 及 8 进 制 以 外 的 进 制 并 不 第 见 。 这 种 写法 借鉴 日 Ada 编 程 语 言 。 
] 6#FFfEFFEE 


2#10101 
36#22 


还 有 ,利用 下 面 的 $s 前 级 记 法 可 以 得 到 任意 字符 的 数值 编码 ( ASCIIL/Latin-1/Unicode 加 可 , 试 试看 ): 

$9 

SZ 

SA 

等 我 们 在 2.2.6 节 讨论 字符 串 时 你 还 会 再 看 到 这 个 记 法 。 

2. 浮 点 数 

浮 点 数 采 用 64 位 IEEE 754-1985 格 式 ( 双 精 度 )， 其 语法 与 大 部 分 编程 语言 相同 ， 唯 一 的 区 别 
是 许多 语言 允许 浮 点 数 以 小 数 点 开头 ， 如 .01， 而 Erlang 要 求 必 须 以 数字 开头 ， 如 0.01: 

3.14 

-0 .123 

299792458.C 


6.022137e23 
6.6720e-11 























J 唯一 的 限制 就 是 物理 内 存 的 大 小 。 





译 者 注 
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Erlang 没 有 单 精度 浮 点 数 。C/C++/Java 中 的 float 指 代 单 精度 浮 点 数 ， 有 这 些 语言 背景 的 程序 
员 需 要 特别 注意 这 一 点 。 

3. 算术 运算 与 位 运算 

Erlang 中 常用 的 算术 运算 符 都 采用 常见 的 中 缀 表示 法 ，+、-、* 的 行为 也 符合 常规 。 如 有 果 参 
与 二 元 运算 的 两 个 参数 中 有 浮 点 数 ， 运 算 将 被 转 为 浮 点 型 ，Erlang 将 在 必要 时 目 动 将 整 型 参数 转 
成 浮 点 型 。 例 如 ，2 * 3.14 的 结果 是 浮 点 数 6.28。 

除法 则 分 两 种 。 首 先是 /运算 符 ， 它 总 是 返回 浮 点 数 : 例如 ，4/2 的 结果 是 2.0， 而 不 是 2。 整 
除 运算 〈 运算 结果 会 被 截断 ) 则 由 div 运算 符 实 现 ， 如 7 div 2， 结 果 是 3。 

整除 运算 对 应 的 余数 可 由 运算 符 rem 实 现 ， 如 15 rem 4， 结 果 是 3。( 涉及 负数 时 结果 取决 
于 取 模 运算 。) 

其 余 的 浮 点 函数 位 于 标准 库 模 块 math 中 ， 下 接 根 据 C 标 准 库 中 对 应 的 消 数 命名 ， 如 
math:sqrt(2)。 

另外 还 有 一 些 用 于 整数 位 运算 的 运算 符 : N bsl kK 表 示 将 整数 N 左 移 K 位 ，bsr 是 右 移 。 位 
逻辑 运算 符 分 别 是 banda、bor 、bxor 和 bnot。 例 如 ，X band (bnot Y) 会 在 X 中 将 7 所 占用 的 
位 清 零 。 


关于 数值 数据 类 型 就 介绍 到 这 里 ， 我 们 再 来 看 看 为 一 类 同样 基础 的 数据 类 型 位 和 季 市 。 


2.2.2 二进制 串 与 位 串 


二 进 制 串 加 是 无 符号 8 位 宇 贡 的 序列 ， 用 于 存放 和 处 理 数据 块 〈《 通 稼 是 旋 目 文件 或 通过 某 网 
络 协议 接收 到 的 数据 )。 位 囊 则 是 广义 的 二 进 制 串 ， 其 长 度 不 必 是 8 的 整数 倍 ， 如 一 个 半 字 市 共 
[2 

长 度 不 受 限 制 的 位 串 是 最 近 才 加 入 语言 的 新 特性 , 按 字 节 对 齐 的 二 进 制 串 则 已 经 有 多 年 历史 
了 。 但 对 程序 员 而 言 二 者 的 表面 差异 并 不 大 ,只 是 如 今 可 以 借助 位 串 完成 一 些 以 往 无 法 完成 的 轻 
巧 任务 。 由 于 语法 相同 ， 二 进 制 囊 的 概念 又 如 此 深入 人 心 ， 现在 已 经 没什么 人 ( 包括 我 们 ) 再 用 
位 串 这 个 说 法 了 ， 除 非 是 有 必要 强调 长 度 方面 的 灵活 性 。 

二 进 制 串 的 基本 语法 如 下 : 



























































能 含有 空格 ， 如 不 能 写成 < <。 二 进 制 串 内 可 以 容纳 任意 多 个 子 市 ， 例 如 ，<<>> 表 未 一 个 空 二 进 
制 串 。 

我 们 还 可 以 用 字符 串 构 造 二 进 制 串 ， 比 如 : 

<<'"hello'", 32, "dude'"™>> 
这 与 直接 输入 字符 串 中 相应 字符 的 8 位 编码 ( ASCILLatin-1 ) 的 效果 相同 。 所 以 ， 这 种 写法 仅 限 
于 8 位 字符 ， 不 过 在 处 理 基 于 文本 的 协议 时 党 第 会 用 到 它 。 

这 些 简单 示例 只 展示 了 如 何 创建 长 度 为 8 的 整数 倍 的 二 进 制 串 。Erlang 偿 有 一 种 更 高 级 也 更 复 
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琳 的 语法 ， 用 于 构造 新 型 的 二 进 制 串 或 者 说 位 串 ， 并 可 针对 位 串 进 行 模 式 匹 配 和 数据 提取 。 稍 后 
我 们 将 在 2.10 市 再 给 出 一 些 示 例 。 

下 一 个 主题 要 讨论 的 数据 类 型 ， 对 Erlang 程 序 员 来 说 几乎 跟 数 值 和 二 进 制 位 同样 基本 ， 它 就 
是 : 原子 (atom ) 。 





2.2.3 原子 


在 Erlang 中 ， 原 子 是 一 种 仅 由 字符 序列 来 标识 的 特殊 字符 串 稼 量 ， 因 此 两 个 原子 只 要 具有 相 
同 的 字符 表示 ， 就 完全 等 同 。 但 在 系统 内 部 ， 这 些 字 符 驯 存放 在 采 张 表 内 ， 并 由 表 的 下 标定 位 ， 
此 在 运行 时 只 要 比较 两 个 小 整数 就 可 以 判断 两 个 原子 是 否 相 等 。 每 个 原子 也 仅 折 一 个 字 长 的 内 
存 。( 特定 原子 的 下 标 是 在 运行 时 目 动 分 配 的 ， 但 系统 每 次 运行 的 时 候 分 配 的 下 标 可 能 不 同 ; 用 
户 无 从 知晓 ， 也 无 须知 晓 这 一 点 。) 

在 Erlang 中 ， 原 子 的 作用 类 似 于 Java 或 C 中 的 enum 常 量 : 用 作 标 签 。 区 别 在 于 无 须 事先 声明 
原子 ; 你 可 以 随意 创建 并 随处 使 用 各 种 新 的 原子 。( 不 妨 在 shell 中 试 试 后 续 的 示例 。) 在 Lisp 编 程 
语言 中 ， 它 们 被 称 为 符号 (symbol ) 。 比 起 数值 常量 ， 用 原子 编程 更 简单 、 更 可 谈 ， 对 用 户 也 更 
友好 。 

通常 情况 下 ， 原 子 以 小 写 子 母 开 头 ， 如 : 

ok 

ea 


unaqaefineda 
trap exit 


在 首 字 母 之 后 ， 可 以 使 用 大 写字 母 、 数 字 、 下 划 线 和 @， 如 : 


route6e6 















































atoms often contain underscore 
pleaseDoNotUseCamelCaseInAtomsItLooksAwful 
vader@Gdeathstar 














如 采 还 要 用 到 其 他 字符 , 你 就 得 给 它们 加 上 单 引号 (当然 你 也 可 以 给 前 面 的 那些 原子 加 上 单 
引 写 一 一 有 了 时 为 了 表述 明确 ， 确 实 会 在 文档 之 类 的 地 方 这 么 做 ): 

1 驴 竺 井 大 1 1 

'Blanks and Capitals can be guoted' 

'Anything inside single-gquotes\n is an atom' 


你 应 该 把 原子 当 作 一 类 特殊 的 标签 ， 而 不 是 普通 的 字符 串 。 它 们 的 长 度 上 限 是 255 个 字符 ， 
在 单个 系统 中 原子 的 总 数 也 有 一 个 上 限 : 目前 是 一 百 多 万 (准确 地 说 是 1 048 576 )。 一般 来 说 这 
个 上 限 已 经 足够 大 了 ,但 对 于 长 期 运行 ( 数 天 、 数 月 、 数 年 ) 的 系统 ， 你 应 该 避免 动态 生成 诸如 
'x_4711' 、'x_4712' 这 类 全 局 唯一 的 原子 。 原 子 一 经 创建 ， 即 便 不 再 使 用 也 永远 不 会 被 清除 ， 
除非 系统 重启 。 

以 下 几 个 原子 几乎 所 有 Erlang 程 序 都 会 用 到 : 

口 true 和 false 用 于 布尔 运算 : 
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口 ok 用 于 那些 返回 值 没 有 任何 实际 意义 、 仪 通过 副作用 发 挥 作用 的 也 数 (在 C 或 Java 中 ， 这 
个 场景 可 以 用 voidq 来 解决 ); 
D undefined 用 作 表 示 未 知 量 的 占 位 符 。 
现在 我 们 已 经 学 完了 基本 数据 类 型 , 该 来 看 看 如 何 创建 更 为 复杂 的 数据 结构 了 ,让 我 们 从 元 
组 讲 起 。 











2.2.4 ”元 组 


元 组 (或 n 元 组 ， 即 三 元 组 、 四 元 组 等 的 一 般 形式 ) 是 其 他 Erlang 项 式 的 定 长 有 序 序列 。 元 组 
{1, 2, 3} 

{one, two, three, ftour} 

{from, "Russia", "With love"} 


{complex, {nested, "structure", {here}}} 


{ 
可 以 看 到 ， 元 组 可 以 包含 零 个 (1} )、 一 个 ( {here} ) 或 多 个 元 素 。 这 些 元 素 可 以 是 同一 类 型 ， 
也 可 以 是 不 同 的 数据 类 型 ; 这 些 元 素 本 身 也 可 以 是 元 组 或 任意 其 他 数据 类 型 。 

Erlang 的 一 个 标准 约定 是 用 原子 作为 第 一 个 元 素来 标记 元 组 数据 的 类 别 ， 如 {size，421} 或 
{position，5，2}。 这 称 为 标记 元 组 ( tagged tuple )。 

正如 C 中 的 struct 或 Java 中 的 对 象 一 样 ， 元 组 是 在 Erlang 中 构造 复合 数据 结构 或 一 次 性 返回 多 
个 结 采 值 的 主要 手段 ; 只 是 元 组 的 元 素 项 没有 名 称 ， 只 有 编号 〈 从 1 到 N)。 访 问 元 组 中 的 元 素 是 
第 数 时 间 复 杂 度 的 操作 ， 跟 在 Java 中 访问 数组 元 条 一 样 快速 ( 和 安全 )。 借 助 后 续 即 将 介绍 的 记 
录 语 法 ， 你 可 以 给 元 组 中 的 元 素 项 命名 ， 这 样 就 不 用 直接 使 用 下 标 了 。 另 外 ,通过 模式 匹配 还 可 
以 简单 地 用 变量 来 引用 元 组 的 不 同 部 分 ， 因 此 很 少 需要 直接 用 下 标 来 访问 元 素 项 。 

标准 库 中 的 模块 实现 了 一 些 更 为 复杂 的 抽象 数据 类 型 ， 如 数组 、 集 合 、 字 上 典 ( 即 关 联 数组 或 
哈 布 表 ) 等 ; 但 在 底层 ， 它 们 大 都 是 采用 各 种 手段 基于 元 组 实现 的 。 

元 组 针对 的 是 定 长 序列 。 要 人 处理 变 长 序列 ， 你 就 需要 用 到 列表 。 












































2.2.5 列表 


列表 是 Erlang 各 种 数据 类 型 中 真正 的 主力 军 一 一 在 这 点 上 大 部 分 涵 数 式 语言 都 是 相通 的 。 原 
因 在 于 列表 的 人 简单、 融 效 和 灵活 , 还 有 就 是 它 天 然 休 人 循 引用 天 明 性 一 一 其 基本 思想 是 被 名 称 所 引 
用 的 值 不 可 更 改 (详情 参见 附录 B )。 列表 可 用 于 存放 任意 多 个 项 式 。 我们 用 方 插 号 表示 列表 ， 以 
下 是 一 些 列表 最 简单 的 例子 : 
[ 
[Ly 人 
[one, two, threel] 
[[1,2,3],[4,5,.6|]] 
[{tomorrow, "buy cheese"}, 


{Soon, "fix trap door"}, 
{later, "repair moon rocket"}. 
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所 以 ， 列 表 就 是 雪 个 或 多 个 Erlang 项 式 〈 项 式 本 里 也 可 以 是 列表 ) 的 序列 。 空 表 [] 也 被 称 为 
nil， 这 个 名 字源 目 Lisp 编 程 语言 ， 它 更 像 是 个 原 了 于 ， 特 别 是 它 的 值 也 只 占 一 个 字 长 的 内 存 。 

添加 列表 元 素 

有 件 事 用 元 组 无 法 简单 高 效 地 完成 , 用 列表 却 可 以 , 那 就 是 以 现 有 的 列表 为 基础 创建 一 个 新 
的 、 更 长 的 列表 ， 并 使 原 列 表 成 为 新 列表 的 一 部 分 。|( 管道 符 ) 的 作用 全 在 此 。 例 如 : 

[1 | [ 

它 将 | 右 侧 的 空 表 与 左 侧 的 元 素 1 合 并 ， 得 到 列表 [1] 。 请 在 shell 中 试 试 ， 杀 眼看 看 这 个 示例 
是 如 何 工作 的 。 以 此 类 推 : 














[2| 0 
可 得 到 列表 [2,1] (注意 顺序 : 新 元 系 应 从 左 侧 诱 加 )。 你 也 可 以 一 次 性 添加 多 个 元 系 , 但 只 能 
从 | 左 侧 添 加 : 





I i 
这 将 得 到 [5,4,3,2,1]。 此 处 的 酚 加 顺序 同 之 前 添加 的 1 和 2 一 样 ， 先 水 加 3， 再 是 4， 最 后 是 $， 
只 是 任务 分 解 工 作 由 编译 器 代为 完成 了 而 已 。 

另外 ， 你 还 可 以 用 ++ 运 算 符 癌 列 表 追 加 任意 长 度 的 列表 。 例 如 : 

[1,2,3,4] ++ [5,6,7,8. 
可 以 得 到 列表 [1,2,3,4,5,6,7,8] 。 其 过 程 还 是 一 样 : 先是 [4|[5,6,7,8]] ， 再 是 
[3|[4,5,6,7,8]]， 以 此 类 推 , 最 后 是 [1| [2,3,4,5,6,7,8]]。++ 右 侧 的 列表 不 会 被 修改 一 一 
Erlang 不 允许 这 类 破坏 性 修改 一 一 它 只 是 借 由 一 个 指针 成 为 了 新 列表 的 一 部 分 。 这 也 意味 着 ++ 运 
算 符 不 关心 右 侧 列表 的 长 度 ， 因 为 根本 就 用 不 上 。 

左 侧 的 列表 可 就 不 一 样 了 。 要 想 以 前 面 介 绍 的 方式 构造 新 列表 ,就 必须 先 找 到 左 侧 列表 的 末 
尾 ( 这 个 例子 中 是 元 素 4 )， 再 从 后 往 前 逐步 完成 新 列表 的 构造 。 也 就 是 说 左 侧 列表 的 长 度 决定 了 
++ 运 算 符 的 耗 时 。 有 鉴于 此 ， 新 内 容 ( 通常 较 短 ) 应 该 尽量 从 左 侧 加 入 列表 ， 即 便 最 终 得 到 的 列 
表 是 逆序 的 也 无 妨 。 随 独 新 元 素 的 加 入 ， 列 表 越 来 越 长 ,与 其 每 次 都 为 了 在 列表 未 尾 添加 元 素 而 
反复 遍历 列表 ， 还 不 如 最 后 用 一 个 涵 数 调用 快速 反 转 逆序 的 列表 ( 在 这 点 上 请 务必 相信 我 们 )。 

Erlang 还 用 列表 来 表示 男 一 种 第 用 数据 文本 字符 串 。 





、 
pe 























2.2.6 ”字符 忠 


Erlang 中 的 双 引 号 字符 串 实 际 上 就 是 列表 ， 其 元 系 就 是 该 字符 串 中 各 字符 的 数值 编码 所 对 应 
的 整数 。 比 如 下 列 这 些 字 符 串 : 
"abcad" 


"Hellol' 
1 \t\r\n' 


它们 与 以 下 列表 等 价 : 
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[97,98,99,100] 
[72,101,108,108,111,33. 
[32,9,13,10] 

[ 


还 可 写作 : 


[Si Tb Te 3590] 

[SH Se Sy SL; So $I 
[SN , SM\t, S$S\r, S\nl] 

[] 


(你 还 记得 前 儿 页 讨论 整数 的 那 一 节 中 提 到 的 $ 语 法 吧 )。 这 层 对 应 关系 在 Erlang 标 准 库 的 某 
些 困 数 的 名 字 上 也 有 所 体现 ， 如 atom_ to list (A) ， 它 返 回 任意 原子 A 中 所 有 字符 组 成 的 列表 "。 

字符 串 就 是 列表 , 也 就 是 说 你 先前 学 到 的 所 有 处 理 列 表 的 方法 也 同样 适用 于 字符 串 , 许多 字 
符 串 编程 任务 仅 靠 基本 的 列表 处 理 技巧 就 足以 完成 。 然 而 , 这 种 设计 也 有 缺点 ， 其 中 之 一 就 是 当 
你 拿 到 一 个 包含 香干 小 整数 的 列表 时 很 难 判 断 它 到 底 是 不 是 个 字符 串 。 

字符 串 与 shell 

Erlang shell 为 了 区 别 对 待 字 符 串 和 普通 列表 ,会 检查 列表 的 元 素 是 否 全 部 为 可 打印 字符 。 如 
果 是 ,就 打印 成 双 引 号 字符 串 ， 否则 就 打印 为 整数 列表 。 这 样 对 用 户 更 为 友好 ,但 偶尔 也 会 不 如 
愿 (例如 ， 当 某 表达 式 返 回 一 个 看 似 由 可 打印 字符 组 成 的 整数 列表 时 ， 你 就 会 看 到 一 行 乱码 )。 

有 一 个 适用 于 这 种 状况 的 技巧 ， 就 是 在 列表 起 始 处 加 一 个 零 ， 迫使 shell 打 印 出 实际 内 容 。 例 
如 ， 知 v(1) 显示 为 字符 串 ，[0 | v(1)] 就 不 会 。( 当然 你 也 可 以 全 权 擎 控 打 印 寅 略 ， 用 标准 库 
闻 数 中 的 字符 串 格 式 化 函数 来 美化 打印 结果 ， 但 那 多 没劲 儿 啊 ? ) 

现在 你 已 经 知道 如 何 构造 复杂 数据 结构 了 , 我 们 马上 讲解 剩 下 的 基本 数据 类 型 : 标识 符 和 fun 















































2.2.7 pid、 端 口 和 引用 


这 3 种 标识 符 数据 类 型 密切 相关 ， 因 此 我 们 一 并 在 此 进行 介绍 。 

1. pid〈 进 程 标 识 符 ) 

你 已 经 知道 ，Erlang 支 持 用 进程 编程 ， 任 何 代 人 码 都 需要 一 个 Erlang 进 程 作为 载体 才能 执行 。 
每 个 进程 都 有 一 个 唯一 标识 从 ， 通 常 称 作 pid。pid 是 一 种 特殊 的 Erlang 数 据 类 型 ， 应 被 视 为 一 种 
不 透明 对 和 象 。 但 shell 会 以 <0 .35 .0> 这 样 的 格式 打 Fhpid 一 一 即 包 含 在 尖 插 号 内 的 3 个 整数 。 在 shell 
中 你 不 能 用 这 个 语法 创建 pid; 该 格式 仅 用 于 调试 目的 ， 以 方便 你 对 pid 进 行 比较 。 

尽管 可 以 认为 在 系统 生存 期 内 所 有 的 pid 都 是 唯一 的 〈 除非 重启 Erlang )， 但 事实 上 当 系 统 的 
运行 时 间 长 到 一 定 程度 ， 前 前 后 后 创建 的 进程 总 数 过 亿 时 ， 进 程 标 识 符 就 有 可 能 被 重用 。 不 过 一 
般 来 说 这 不 是 什么 问题 。 

self () 限 数 能 告诉 你 当前 进程 ( 即 调 用 self () 的 那个 进程 ) 的 pid。 请 在 shell 里 试 一 试 一 一 
没 错 ，shell 本 里 也 是 一 个 Erlang 进 程 。 























QD 即 返 回 字面 上 和 该 原子 相同 的 字符 串 ， 如 将 原子 'abc ' 转 为 字符 串 "abc"。 一 一 译 者 注 
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2. 端口 标识 符 

端口 与 进程 差不多 ， 只 是 还 能 与 Erlang 外 界 通 信 (其 能 力 基本 上 也 就 仅 此 而 已 一 一 尤其 是 ， 
端口 不 具备 代码 执行 能 力 )。 因 此 ， 端 口 标识 符 与 pid 密 切 相 关 ，shel 打 印 端口 的 格式 为 
#Port<0.472>。 本 书后 续 还 会 针对 端口 进行 讨论 。 

3. 引用 

这 类 数据 类 型 中 的 第 三 种 数据 类 型 就 是 引用 ( 常 锌 称 作 ref ), 可 由 make_ref () 国 数 生成 ( 试 
一 下 ! )， 其 shell 输 出 格式 为 #Ref<0.0.0.39>。3 引 用 和 常 被 用 作 各 种 要 求 保证 唯一 性 的 一 次 性 标签 
或 cookie。 














2.2.8 ”将 函数 视 作 数据 : fun 函 数 


Erlang 被 称 为 函数 式 语 言 ， 这 类 语言 的 一 个 显著 特征 就 是 可 以 像 处 理 数据 一 样 处 理 也 数 一 一 也 
就 是 说 ， 函 数 可 以 成 为 别 的 函数 的 输入 ,也 可 以 成 为 别 的 函数 的 求 值 结果 ,还 可 以 把 函数 存在 数 
据 结 构 中 供 后 续 使 用 ， 诸如此类。 当然 ,还 要 提供 孔 数 调用 机 制 。 在 Erlang 中 ， 这 种 将 函数 包装 
成 数据 的 对 象 称 作 fun 函数 〈 也 称 作 Lambda 表 达 式 或 闭 包 )。 

我 们 将 在 2.5 闻 大 略 介 绍 阻 数 ， 然 后 在 2.7 节 详细 阐述 fun 函 数 。 请 注意 虽然 shell 按 #Fun<.. .> 
的 格式 打印 函数 ( 尖 括 号 内 是 一 些 调试 信息 )， 你 却 无 法 用 这 个 语法 来 创建 fun 对 象 。 

至 此 , 最 后 一 种 内 置 数 据 类 型 也 介绍 完了 。 下 一 个 话题 需要 综合 所 有 内 置 数 据 类 型 .比较 运 
算 符 。 


2.2.9 ”项 式 的 比较 


Erlang 的 各 种 数据 类 型 有 一 个 共同 点 :它们 都 可 通过 内 置 的 <、 > 和 == 运 算 符 进行 比较 和 排序 。 
常规 的 数值 排序 自然 不 在 话 下 ， 比 如 1 < 2 以 及 3.14 > 3 等 , 原子、 字符 串 (以 及 其 他 各 种 列 
表 ) 和 元 组 则 按 字 典 序 排序 ,因此 有 'abacus' < 'abba' "zzz" > "zzy"、[1,2,3] > [1,2,2,1] 
以 及 {fredq,baker ,42}】 < {fredq,cook,181。 

这 些 都 还 算 和 常规 ; 但 除 此 之 外 ,不 同类 型 之 间 也 有 一 套 排 序 规则 ， 比 如 42 < 'aardvark'、 
[1,2,3] > {1,2,3} 以 及 'abc' < "abc"。 更 准确 地 说 ， 数 值 小 于 原子 ， 元 组 小 于 列表 ， 而 原 
子 既 小 于 元 组 也 小 于 列表 〈 别 乐 了 字符 串 也 是 列表 )。 

你 没 必要 强 记 不 同 数据 类 型 间 的 排序 规则 。 只 要 记 住 任意 两 个 项 式 都 可 比较 , 且 结 果 总 是 确 
定 的 就 可 以 了 。 尤其 是 在 用 标准 库 函 数 1ist :sort(...) 对 列表 进行 排序 时 ， 即 便 列表 中 温 有 多 
种 类 型 的 项 式 ( 数值、 字符 串 、 原 子 、 元 组 …… )， 也 总 能 得 到 一 个 排 好 序 的 列表 ， 其 中 最 前 面 
的 是 数值 ,接着 是 原子 ,以 此 类 推 ,你 可 以 在 shell 中 试 试 :比如 1ist:sort([b,3,a,"z",1,c,"x", 
2.97"Y"])s 

1. 小 于 或 等 于 /大 于 或 等 于 

在 语法 上 ，Erlang 跟 大 多 数 语 言 (Prolog 除 外 ) 有 一 个 细微 的 区 别 ， 就 是 小 于 或 等 于 运算 符 
不 写作 <=， 原 因 在 于 这 看 起 来 太 像 是 个 指 回 左 侧 的 箭头 〈 这 个 符号 也 确实 被 用 作 左 箭头 )。 取 而 
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代 之 ， 小 于 或 等 于 写作 =<。 大 于 或 等 于 运算 符 则 跟 大 部 分 语言 一 样 ， 写 作 >=。 和 总 之 ， 你 只 要 记 
住 比较 运算 符 看 起 来 绝 不 像 箭 头 就 行 了 。 

2. 相等 比较 

Erlang 有 两 种 相等 比较 运算 符 。 第 一 种 是 完全 相等 ， 写 作 =:=， 仅 当 运 算 符 两 侧 完全 等 同 " 时 
才 返 回 true。 例如 ，42 =:= 42。 其 否定 形式 〈 不 完全 相等 ) 写作 =/=， 如 1 =/= 2。 

一 般 来 说 , 判断 两 个 项 式 是 否 相等 时 更 倾 问 于 采用 完全 相等 运算 符 (我 们 后 续 将 要 讨论 的 模 
式 匹 配 也 用 它 来 比较 项 式 )。. 但 这 会 导致 看 似 相等 的 整数 与 浮 点 数 被 判 为 不 相等 。 比 如 ,2 =:= 2.0 
的 结 采 就 是 false。 

按 数 学 法 则 对 数值 (或 包含 数值 的 元 组 ， 如 疝 量 ) 进行 比较 时 , 一般 应 该 改 用 算数 相等 运算 
从， 写作 ==。 必 要 时 它 会 将 整数 强制 转换 为 浮 点 数 再 进行 比较 。 这 样 一 来 ，2 == 2.0 返 回 的 就 
是 true 了 。 其 否定 形式 ( 算数 不 等 ) 写作 /=。 例如 ， 2 /= 2.0 返 回 的 是 false。 但 请 记 住 ， 外 
对 浮 点 数 做 相等 判断 总 是 有 风险 的 , 浮 点 数 的 机 硕 表 示 法 伴 有 微小 的 舍 人 误差 , 这 可 能 会 在 本 应 
相等 的 数值 间 引 入 些微 的 偏差 ， 使 == 返 回 false。 涉 及 浮 点 数 时 最 好 只 用 <、>、=< 或 >= 进 行 比 
较 。 这 些 都 是 算术 运算 符 一 一 必要 时 它们 都 会 将 整数 转 为 浮 点 数 。 这 天 是 为 什么 之 前 你 能 用 > 来 
比较 3 和 3.14。 

==( 文 持 数 值 类 型 转换 的 算术 相等 比较 运算 符 ) 的 正确 性 是 得 不 到 保障 的 一 一 除了 算术 运 
算 以 外 , 它 基 本 上 总 有 问题 一 一 在 程序 中 使 用 == 只 会 难为 Dialyzer 这 类 帮 你 定位 程序 不 良 行为 的 
程序 分 析 工 具 。 这 人 么 做 还 会 手 盖 一 些 本 该 早早 现 出 原形 的 运行 时 错误 ， 以 至 于 只 有 在 文件 或 数 
据 库 中 出 现 莫名 其 妙 的 数据 时 你 才 会 意识 到 问题 的 存在 ( 比如 显示 成 1970.0 的 年 份 或 是 显示 成 2.0 
的 月 份 )。 

有 所以， 老练 的 Erlang 程 序 员 是 不 用 相等 比较 运算 符 的 ， 他 们 会 尽量 使 用 2.4.3 市 所 讨论 的 模式 
匹配 。 



























































2.2.10 解读 列表 





与 大 多 数 常见 编程 语言 中 的 列表 不 同 ，Erlang 的 列表 非常 与 众 不 同 ， 在 这 个 有 关 数 据 类 型 的 
话题 结束 之 前 我 们 有 必要 给 予 它 一 些 特别 关注 。 

1. 列表 的 结构 

列表 一 般 是 由 空 表 (nil ) 和 所 谓 的 列表 单元 共同 构成 的 。 这 些 单元 各 自 携 带 一 个 元 素 挨 个 儿 
挂 接 到 现 有 列表 的 顶部 ， 从 而 在 内 存 中 形成 一 个 单 链 表 。 每 个 单元 仅 占 用 两 个 字 长 的 内 存 空 间 : 
一 个 用 于 存放 元 素 值 (或 指 加 元素 值 的 指针 )， 称 为 首部 (head )， 另 一 个 是 指向 列表 其 余部 分 的 

针 ， 称 为 尾部 (tail )， 参见 图 2-1。 有 时 ， 有 Lisp 或 函数 式 编程 背景 的 人 会 将 列表 单元 称 作 cons 

单元 ( 源 日 list constructor )， 装 配 cons 单 元 的 动作 也 被 一 些 喜 欢 标 新 立 异 的 人 称 作 consing 。 























J 完全 等 同 的 意思 是 值 和 类 型 都 必须 相同 。 一 一 译 者 注 
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入 列表 的 其 余部 分 


元 素 
图 2-1 列表 单元 一 一 列表 的 基本 构件 ( 两 块 相 邻 的 单字 长 内 存 区 域 ) 


尽管 从 技术 角度 看 列表 竺 元 的 首尾 元 系 没有 什么 差别 , 但 习惯 上 第 一 个 ( 首部 ) 总 是 用 于 保 
存 该 单元 所 携 市 的 元 系 值 ,第 二 个 (尾部 ) 则 指向 列表 的 其 余部 分 。 列 表 的 语法 以 及 所 有 针对 列 
表 操 作 的 库 函 数 都 名 循 这 个 惯例 。 

初学 者 经 负 踩 到 的 一 个 吉 是 误 把 管道 符 与 成 逗号 〈 老 手 们 也 时 第 会 犯 这 个 于 误 )。 看 看 这 
个 例子 : 以 下 两 个 表达 式 有 什么 区 别 ? 


| 
MO 


(看 看 你 能 人 耕 随 者 阅读 的 逐步 深入 看 出 些 端 倪 。 想 要 提示 的 话 就 到 shell 里 去 试 试 吧 。 ) 

答案 揭晓 ， 第 一 个 表达 式 是 一 个 包含 3 个 元 系 的 列表 ， 其 中 最 后 一 个 元 素 本 身 也 是 一 个 列表 
(包含 两 个 元 系 )。 第 二 个 表达 式 是 一 个 在 列表 [3,4] 上 堆 生 两 个 元 系 后 形成 的 包含 四 个 元 素 的 列 
表 。 图 2-2 展 示 了 这 两 个 表达 式 的 结构 。 在 继续 学 习 前 请 务必 把 这 部 分 内 容 理 解 透彻 一 一 这 是 有 
关 列 表 的 一 切 知 识 的 核心 。 男 外 可 参考 附录 B 中 对 列表 和 引用 透明 性 所 做 的 更 为 深入 的 论述 。 









































表 。 右 侧 的 列表 则 包含 3 个 元 到 [1, 2,x] ， 其 中 最 后 一 个 元 素 x 是 列表 [3 ,4] 


你 会 慢 慢 地 爱 上 列表 。 但 请 记 住 ,列表 主要 用 于 存放 临时 数据 ( 比如 用 作 当 前 正在 处 理 的 数 
据 的 容器 )、 编 排 中 间 结 果 ， 或 是 用 作 字 符 串 缓冲 。 对 于 需要 长 期 存储 的 数据 ， 如 果 尺 寸 因素 很 
关键 ， 你 可 能 就 得 考虑 用 别 的 办 法 了 ， 比 如 用 二 进 制 串 来 存放 较 大 的 字符 串 常量 数据 。 

随后 你 会 看 到 ，Erlang 中 包括 字符 串 操 作 在 内 的 大 部 分 数据 处 理 ， 都 可 归结 于 列表 遍历 ， 跟 
你 在 大 多 数 其 他 语言 中 过 有 历 容 顺和 数组 差不多 。 列 表 将 是 你 的 主要 中 介 数 据 结构 。 

2. 非 严 格 列表 

最 后 一 个 要 注意 的 问题 就 是 严格 列表 与 非 严 格 列表 的 区 别 。 迄今 为 止 , 你 碰 到 的 都 是 严格 列 
表 。 它们 在 最 内 层 都 以 一 个 空 表 作 为 尾部 。 也 就 是 说 ， 从 最 外 层 开 始 一 次 摘 挥 一 个 单元 ， 最 后 简 
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下 的 那个 单元 的 尾部 肯定 是 个 空 表 。 

非 严 格 列表 则 是 在 非 列表 数据 之 上 堆 苔 列表 单元 而 成 的 列表 。 例 如 : 

[ 1 | ooops 
这 样 就 构成 了 一 个 尾部 不 是 列表 的 列表 单元 ( 此 处 以 原子 'oops ' 作 为 尾部 )。Erlang 并 不 禁止 这 
样 做 ,也 不 会 在 运行 时 对 这 种 情况 进行 检查 。 但 一 般 来 说 ,要 是 看 到 这 样 的 东西 ， 那 多 半 是 程序 
的 某 些 地 方 与 销 了 。 

非 严 格 列表 的 主要 问题 在 于 , 很 多 函数 要 求 输入 参数 必须 是 严格 列表 ,， 如 采 传 人 一 个 非 严 格 
列表 ， 这 些 函 数 在 过 历 列表 时 最 终 都 会 看 到 一 个 不 是 列表 的 尾部 ， 进 而 导致 衣 泪 〈 抛 出 异 各 )。 
即便 你 觉得 自己 想到 了 一 个 很 高 明 的 点 子 , 也 不 要 冒险 以 这 种 方式 去 使 用 列表 单元 一 一 这 样 做 很 
容易 出 错 , 既 会 迷惑 人 也 会 迷惑 程序 分 析 工 具 。 虽然 的 确 存 在 那么 一 两 种 正确 运用 非 严 格 列表 的 
方式 ， 但 它们 已 经 是 超出 本 书 讨论 范畴 的 高 级 编程 技巧 了 。 

有 关 Erlang 基 本 数据 结构 的 讨论 就 到 此 为 止 耻 ， 我 们 即将 进入 下 一 个 主题 ， 看 看 程序 的 创建 
以 及 如 何 编 译 执 行程 序 。 首 和 完 ， 我 们 来 聊 聊 代码 的 居所 函数 以 及 模块 。 


2.3 ”模块 和 函数 


日前 为 止 ， 你 看 到 的 都 只 是 基本 的 Erlang 表 达 式 : 可 经 由 计算 而 返回 荣 些 值 的 代码 片段 。 实 
际 的 Erlang 程 序 可 没 法 在 shell 里 一 行 搞定 。 为 了 赋予 代码 活络 的 结构 和 稳定 的 居所 ，Erlang 将 模 
块 用 作 代 码 的 容 各 。 每 个 模块 的 名 字 都 是 一 个 全 局 唯一 的 原子 。Erlang 标 准 库 中 包含 大 量 预 定义 
模块 ， 比 如 内 含 诸多 列表 处理 函数 的 lists 人 模块 。 

本 市 我 们 先 解释 一 些 Erlang 消 数 相 关 的 细 市 : 如 何 调 用 函数 、 函 数 元 数 的 重要 性 、 标 准 库 ， 
以 及 什么 是 BIF。 人 然后 我 们 将 展示 如 何 创建 自己 的 模块 、 如 何 编译 , 以 及 如 何 运 行 模块 中 的 函数 。 
我 们 还 会 简单 解释 一 下 已 编 详 模块 和 在 shell 中 输入 的 代码 之 间 的 区 别 。 首 先 ,我 们 来 看 看 如 何 调 
用 模块 中 的 函数 。 












































2.3.1 调用 其 他 模块 中 的 函数 〈 远 程 调 用 ) 


要 调用 其 他 模块 中 的 函数 , 需要 在 函数 名 之 前 以 冒号 为 分 隔 符 加 上 哨 数 所 处 模块 的 名 字 。 例 
如 , 要 调用 标准 库 模块 lists 中 的 reverse 子 数 来 反 转 列表 [1,2,3]，, 应 写成 (你 可 以 用 shell 试 试 ): 


lists:reverse([1,2,3]} 

这 种 形式 的 函数 调用 被 称 为 远程 调用 ( 调用 其 他 模块 中 的 函数 )， 与 此 相对 应 的 是 本 地 调用 
(调用 同一 模块 中 的 函数 ) 不 要 将 此 处 的 远程 调用 与 远程 过 程 调 用 ( remote procedure call ) 混 消 ， 
那 是 分 布 式 编 程 中 的 一 个 完全 不 同 的 概念 ( 指 的 是 让 别 的 进程 或 计算 机 帮 你 执行 菏 个 函数 )。 

在 上 面 的 例子 中 ， 函 数 的 参数 只 有 一 个 。 用 Erlang 编 程 时 ， 需 要 特别 注意 这 类 细节 。 原 因 将 
在 下 一 六 解释 。 
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2.3.2 不 同 元 数 的 函数 


也 数 参 数 的 个 数 称 作 元 数 。 例 如 ,具有 1 个 参数 的 函数 叫 一 元 函数 ,具有 2 个 参数 的 函数 叫 二 
元 限 数 ， 具 有 3 个 参数 的 函数 叫 三 元 函数 ， 以 此 类 推 。 男 外 还 有 你 已 经 见 过 的 像 self () 这 样 的 空 
元 图 数 一 一 也 就 是 没有 参数 的 函数 。 

跟 其 他 大 多 数 编程 语言 相 比 ， 国 数 的 元 数 在 Erlang 中 要 重要 得 多 。Erlang 中 没有 上 国 数 重 载 之 
类 的 机 制 ， 然 而 ， 即 便 两 个 函数 使 用 同一 原子 作为 函数 名 ， 只 要 它们 的 元 数 不 同 ，Erlang 就 会 将 
它们 视 作 两 个 完全 不 同 的 孔 数 。 因 此 ， 也 数 的 全 名 必须 包含 元 数 ( 以 冬 杠 为 分 阳 符 )。 比 如 ， 前 
面 提 到 的 列表 反 转 孔 数 的 全 名 是 reverse/1; 或 者 ， 右 要 强调 国 数 所 在 的 模块 ， 则 应 写作 
lists:reverse/1。 不 过 请 注意 ， 该 声 法 仅 用 于 需要 困 数 名 的 位 置 ， 如 果 将 hello/2 用 作 表 达 
式 ，Erlang 会 将 之 解释 成 原子 'hello' 除 以 2( 这 可 行 不 通 )。 

为 了 进一步 说 明 ， 不 妨 看 一 下 哺 数 1ists:reverse/2， 它 的 作用 与 reverse/1 儿 平一 样 ， 
但 它 会 进一步 把 第 二 个 参数 追加 到 最 终结 果 中 去 ; 因此 ，1ists:reverse([10,11,12]， 
[9,8,7]) 会 返回 列表 [12,11,10,9,8,7]。 在 某 些 语言 中 ， 为 了 避免 命名 冲突 ， 这 个 函数 可 能 
不 得 不 被 命名 为 reverse_onto 之 类 的 名 字 ， 但 在 Erlang 中 两 个 男 数 可 以 用 同一 个 原子 命名 。 请 
不 要 在 编写 你 目 己 的 函数 时 小 用 这 个 能 命名 应 当 以 系统 化 的 方式 进行 , 这 样 才 容 易 让 用 户 
记 住 如 何 调 用 你 的 函数 。 如 采 你 写 的 孔 数 在 命名 上 只 有 元 数 不 同 ,功能 却 大 相 径 姓 ， 最 终结 果 可 
能 无 法 让 你 满意 。 为 命名 而 摇摆 不 定时 ， 请 尽量 选用 区 分 度 较 高 的 名 字 。 

无 论 如 何 ， 请 记 住 在 讨论 具体 某 一 个 函数 时 一 定 要 说 明 元 数 ， 只 提 函 数 名 是 不 够 的 。 


2.3.3 ”内置 函 效 和 标准 库 模 块 


和 其 他 编程 语言 一 样 ，Erlang 也 上 自沉 一 套 由 各 种 实用 吧 数 组 成 的 标准 库 。 这 些 函 数 散 布 在 大 
量 模块 中 , 各 模块 应 用 广泛 程度 不 一 。 名 为 erlang 的 那个 模块 尤其 重要 , 它 包含 了 整个 Erlang 系 统 
最 核心 的 疯 数 ， 一切 都 以 它 为 基础 。 还 有 一 个 非常 实用 的 模块 就 是 你 已 经 碰 到 过 的 lists 模 块 。io 
模块 人 负责 基本 的 文本 输入 输出 处 理 。dict 模 块 提供 了 基于 散 列 的 关联 数组 (字典 ),， array 模 块 提供 
了 可 扩展 的 、 诗 整数 索引 的 数组 ， 诸 如 此 类 不 一 而 足 。 

有 些 也 数 涉 及 非常 底层 的 内 容 ,以 人 致 于 不 得 不 将 它们 集成 到 语言 和 运行 时 系统 的 内 部 。 这些 
咀 数 通常 称 作 内 置 函 数 ( BIF )， 它 们 和 Erlang 运 行 时 系统 一 样 ， 都 是 用 C 语 言 实现 的 。( 有 人 可 能 
会 对 这 个 定义 的 一 些 细 季 有 异议 ， 但 这 算是 BIF 最 通俗 的 定义 了 。) 需要 强调 的 是 ，erlang 模 块 中 
所 有 的 函数 部 是 BIF。 某 些 BIF， 像 我 们 在 前 一 厄 碰 到 的 lists:reverse/1， 原则 上 完全 可 以 直 
接 用 Erlang 实 现 ( 正如 lists 模 块 中 的 其 他 大 多 数 函 数 那 样 )， 但 为 了 追求 执行 效率 还 是 采用 了 C 来 
实现 。 一 般 来 说 你 不 必 关 心 这 些 图 数 是 怎么 实现 的 从 外 部 看 来 它们 都 一 样 。 但 鉴于 BIF 这 个 
术语 在 Erlang 界 如 此 和 常用， 仍然 有 必要 了 解 一 下 它 所 指 的 是 什么 。 

erlang 模 块 中 的 某 些 重要 洱 数 在 程序 和 shell 中 的 应 用 都 很 广泛 。 因 此 它们 会 被 自动 导入 ,也 
就 是 说 不 必 显 式 给 出 模块 名 。 比 如 你 曾 见 过 的 用 于 返回 当前 进程 标识 的 self () 函数 。 这 是 一 个 
针对 erlang :self() 的 远程 调用 ,但 由 于 该 孙 数 属于 自动 导入 了 数 ， 可 以 省 略 erlang :前 级 。 
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别 的 例子 还 包括 用 于 启动 新 进程 的 spawn (. . .) ， 以 及 用 于 计算 列表 长 度 的 1ength(...) 等 。 最 
后 ，Erlang 语 言 中 的 运算 符 实际 上 也 是 隶属 erlang 模 块 的 内 置 函 数 。 比 如 ，erlang:'+'(1,2) 也 
可 写作 1+2。 

好 了 ， 我 们 已 经 讨论 了 标准 库 中 现 有 的 模块 。 但 如 何 创建 自己 的 模块 呢 ? 谜底 即将 揭晓 。 


2.3.4 创建 模块 


shell 中 的 表达 式 已 经 玩 够 了， 要 想 自 行 开 发 实际 的 Erlang 程 序 ， 就 必须 把 编写 的 代码 放置 到 
一 个 或 多 个 模块 中 。 要 新 开发 一 个 可 供 自 己 或 他 人 重用 的 模块 ， 你 需要 做 几 件 事 : 

(1) 编写 源码 文件 ; 

(2) 编译 ; 

(3) 加 载 已 编译 的 模块 ， 或 将 它 放 到 加 载 路 径 中 以 便 自 动 加 载 。 

第 一 步 很 价 单 一 一 启动 你 最 拿手 的 文本 编辑 需 (Notepad 都 行 )， 打 开 一 个 新 文件 ， 就 可 以 开 
始 开 发 了 。 给 模块 取 一 个 名 字 ， 接 着 用 这 个 名 字 加 上 .erl 后 级 作为 文件 名 保存 文件 。 以 下 的 代码 
清单 展示 了 一 个 名 为 my_module.erl 的 示例 文件 。 赶 快 拿 起 你 的 文本 编辑 器 创建 这 个 文件 吧 。 




















代码 清单 2-1 my module.erl 


SS This is a simple Erlang module 





-module (my module)}). 
-export( [pie/0]). 


pie{() -> 
3.14. 


. “让 我 们 从 最 简单 的 部 分 切 人 ， 写 有 pie() -> 3.14. 的 这 部 分 称 作 函数 定义 。 它 创建 了 一 个 
员 数 pie， 该 函数 不 接受 任何 参数 ， 并 返回 浮 点 数 3.14。 部 数 首部 ( 包含 限 数 名 和 参数 列表 ) 和 
马 数 体 〈 描述 了 也 数 的 用 途 ) 由 箭头 -> 隔离。 请 注意 这 里 不 需要 retum 之 类 的 关键 字 : 函数 的 返 
回 值 就 是 函数 体 中 表达 式 的 值 。 同 时 请 注意 函数 定义 的 末尾 必须 附 上 句号 〈. )， 这 和 在 shell 中 必 
须 在 表达 式 末尾 追加 句号 是 一 样 的 。 

第 二 个 值得 注意 的 地 方 就 是 第 一 行 的 注释 。Erlang 的 注释 用 % 表 示 ， 待 会 儿 我 们 还 会 讨论 到 
注释 。 

除了 注释 ， 模 块 的 第 一 行 一 定 是 模块 声明 ， 其 格式 为 -module(...).。 和 总 的 来 说 ，Erlang 
中 既 非 函数 也 非 注释 的 东西 都 属于 声明 。 声 明 以 连 字符 开头 〈(- )， 并 跟 函 数 定义 一 样 ， 必 须 以 
句号 结尾 。 模 块 声 明 是 不 可 或 缺 的 ， 且 它 指 定 的 名 字 必 须 与 文件 名 相符 〈 即 除去 .erl 后 缀 以 外 的 
部 分 )。 

最 后 要 说 的 是 -export ([...]). 这 一行。 这 是 导出 声明 ， 它 会 告知 编译 各 哪 些 函 数 是 外 部 
可 见 的 。 此 处 没有 列 出 的 函数 都 是 模块 的 内 部 函数 ( 所 以 也 就 无 法 在 shell 中 调用 它们 )。 这 个 例 
子 只 有 一 个 函数 ,， 想 要 用 它 ， 就 得 把 它 放 和 人 导出 列表 。 前 一 节 曾 解释 过 ， 只 有 同时 给 定 函 数 名 和 
元 数 ( 此 处 是 0 ) 才能 唯一 确定 一 个 函数 ， 因 此 ， 这 里 要 写成 pie/0。 
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继续 之 前 ， 我 们 先 来 解释 一 些 和 注释 相关 的 问题 。 





注释 
Erlang 源 码 的 注释 格式 只 有 一 种 。 注 释 从 s 开 始 到 行 尾 结束 。 当 然 ， 字 符 串 和 原子 中 的 gs 不 
算 。 例如 : 


% This is a comment and it ends here. 
"This % does not begin a comment" 


他 


'nor does thig: %' S$<-but this one does 
如 果 乐 意 ， 你 也 可 以 在 shell 中 写 注 释 ， 不 过 这 没什么 意义 ， 所 以 前 面 我 们 也 就 没有 讲 到 这 点 。 
根据 规范 ， 与 代码 同 处 一 行 的 注释 以 一 个 s 开 头 ， 独 占 一 行 的 注释 以 两 个 s 开 头 ， 如 : 


%%S This is your average standalone comment line. 





8%g% Also, longer comments may require more lines. 

frotz() -> blah. % this is a comment on a line of code 
(有 些 人 甚至 喜欢 用 3 个 s 开 头 的 注释 行 来 摘 述 整个 文件 层面 的 信息 ， 璧 如 位 拓 源 码 文件 顶部 的 
注释 。) 

壮 循 这 些 规范 的 理由 之 一 是 Emacs 和 erlIDE 等 具有 语法 感知 能 力 的 编辑 需 能 够 辨别 这 些 注 
释 ， 并 会 根据 行 首 gs 的 数量 目 动 缩 进 注 释 。 

现在 你 已 经 有 了 一 个 源码 文件 ， 并 在 其 中 定义 了 一 个 模块 ， 该 进行 编译 了 。 


2.3.5 ”模块 的 编译 和 加 载 


编译 模块 时 ， 会 产生 一 个 和 模块 对 应 的 扩展 名 为 .beam 而 非 .erl 的 文件 ， 其 中 包含 可 被 Erlang 
系统 加 和 载 执行 的 指令 。 与 源码 相 比 ,， 它 更 为 精简 和 高 效 ， 同时 包含 了 系统 加 载 并 运行 模块 所 需 的 
一 切 内 容 。 相 比 之 下 ,源码 文件 还 有 可 能 通过 包含 声明 来 引用 其 他 文件 ( 参见 2.12.2 方 ),。 模块 被 
编译 时 ， 构 成 该 模块 完整 源码 的 所 有 文件 都 会 被 读 取 。 由 此 ， 单 一 的 .beam 文 件 才 是 模块 更 为 确 
定 的 形态 ， 尺 管 其 可 读 性 很 差 .也 无 法 手工 编辑 一 一 你 只 能 先 修 改 源码 再 重新 编译 。 

1. 在 shell 中 编译 

要 想 在 做 实验 和 测试 时 编译 模块 ， 最 简单 的 办 法 就 是 调用 shell 国 数 c(. . .) ， 它 不 光 负 责 模 
块 的 编译 还 能 完成 模块 加 载 ( 前 提 是 编译 通过 )， 以 便 你 即刻 进行 测试 。 该 图 数 以 Erlang shell 的 
当前 目录 为 相对 路 径 来 寻找 源码 文件 ， 你 甚至 可 以 省 略 模块 名 末尾 的 .erl。 例 如 ， 你 大 在 之 前 建 
立 的 文件 所 在 的 目录 下 启动 Erlang， 便 可 以 这 么 做 : 


1> climy module)}. 



































{ok,my module} 

2> my module:plie{)}). 
3.14 

3> 


c(...) 返 回 的 结果 {ok,my_module} 表 示 编 译 通过 ， 生 成 了 一 个 名 为 my_module 的 模块 ， 并 完 
成 了 加 载 。 你 可 以 通过 调用 该 模块 导出 的 函数 pie 来 进行 验证 。 
检查 源码 文件 所 在 的 目录 (可 以 用 shell 函 数 1s () 完成 )， 你 会 发 现 除 my module.erl 之 外 现在 
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又 多 出 了 一 个 名 为 my module.beam 的 新 文件 。 这 就 是 已 编译 版 本 的 模块 ， 也 称 作 目标 文件 。 

2. 模块 加 载 与 代码 路 径 . 

退出 Erlang shell ( 比如 用 shell 喘 数 q () ) 后 再 于 同一 日 录 下 重启 Erlang, 试 试 跳 过 编译 环节 直 
接 调用 刚才 的 模块 〈 假 设 前 面 已 经 编译 通过 ): 

1> my module:pie!(). 


3.14 
2> 


这 是 为 什么 ? 很 简单 : 当 Erlang 答 试 调用 示 个 尚未 加 载 到 系统 中 的 模块 时 ， 只 要 能 找到 与 模 
块 名 对 应 的 .beam 文 件 ， 它 就 会 日 动 符 试 加 载 。 查 找 .beam 文 件 的 目录 由 代码 路 径 指 定 ， 默 认 情 况 
下 ， 当 前 目录 也 包括 在 内 (你 的 .beam 文 件 也 就 是 在 这 儿 被 找到 并 加 载 的 )。 

调用 code:get_path() 图 数 可 以 检查 当前 的 代码 路 径 设 置 。 该 国 数 返回 一 个 列表 ， 你 会 看 
到 该 列表 的 第 一 个 元 素 是 个 句号 (.), 它 表 示 当 前 目录 。 默 认 代 码 路 径 还 包括 标准 库 目 录 。 此 外 ， 
你 还 可 以 通过 code 模 块 中 的 函数 随意 调整 这 些 路 径 。 























2.3.6 ”独立 编译 器 erlc 


真实 的 软件 项 目 一 般 都 倾 回 于 使 用 GNU Make 这 类 外 部 工具 将 构建 过 程 脚本 化 。 在 这 种 情况 
下 ， 你 可 以 用 独立 的 erlc 程 序 直 接 从 操作 系统 命令 行 里 启动 编译 副 。 例 如 : 


erlc my module.erl 


( 当然 你 可 以 亲手 跑 跑 看 , 试 一 下 ! ) 这 和 之 前 用 shell 函 数 时 有 些 不 同 , 在 这 里 ,你 需要 给 出 包括 .erl 
扩展 名 在 内 的 完整 文件 名 。 你 还 可 以 像 用 C 编 译 硕 那样 指定 各 种 选项 ， 比 如 ， 这 样 写 可 以 指定 输 
出 目录 (放置 .beam 文 件 的 位 置 ): 


erjc -o ./ebin my module.erl 


( 可 能 你 已 经 注音 到 在 code:get_path() 的 例子 中 包含 在 代码 路 径 内 的 所 有 标准 库 目 录 都 以 
/ebin 结 尾 。 按 照 Erlang 的 惯例 ， 存 放 .beam 文 件 的 子 目 录 应 取 名 为 ebin。 回 头等 我 们 讲 到 应 用 时 再 
做 详细 说 明 。) 

Windows 下 的 情形 要 复杂 一 些 : 安 装 程 序 并 未 将 erl 和 erlc 程 序 所 在 的 目录 加 入 PATH 环境 变量 ; 
你 必须 先 自 行 添 加 , 然后 才能 在 cmd.exe 命 令 行 中 运行 这 两 个 程序 。 它 们 位 于 Erlang 安 狼 目 录 的 bin 
子 目 录 下 一 一 路 径 可 能 会 是 C'\Program Files\erl$.7.3\bin 之 类 。 另 外 请 记 住 erl 与 cmd.exe 有 点 儿 合 不 
来 一 一 它 更 适合 于 运行 Erlang 脚 本, 但 奋 要 用 到 交互 式 环境 , 最 好 还 是 用 werl ( 点 击 Erlang 图 标 时 
打开 的 就 是 它 )。 


2.3.7 已 编译 模块 与 在 shell 中 求 值 

在 Erlang shell 求 值 的 表达 式 与 放 在 模块 中 ( 完成 编译 、 加 载 并 运行 ) 的 代码 是 不 同 的 。 我 们 
说 过 ，.beam 文 件 是 模块 的 一 种 高 效 、 可 部 署 的 形态 。 同 一 份 .beam 文 件 中 的 代码 全 部 是 在 同一 时 
间 、 同 一 环境 下 编译 的 。 模 块 中 的 代码 可 以 完成 一 些 模块 相关 的 任务 ， 如 指定 导出 函数 ,查询 模 
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块 名 称 ， 或 声明 模块 相关 的 各 种 其 他 信息 等 。 

而 输入 到 shell 中 的 代码 本 质 上 只 是 一 些 转瞬 即 逝 的 一 次 性 表达 式 。 这 些 代 码 不 属于 任何 模 
块 。 因 此 ,在 shell 中 是 无 法 使 用 声明 的 ( 如 -export ([...]). 或 -module(...).), 这 里 缺乏 这 
类 声明 发 挥 作用 所 需 的 模块 语 境 。 

shell 通 过 动态 解释 的 方式 对 表达 式 进行 解析 和 求 值 。 在 执行 效率 上 ,这 种 做 法 比 已 编译 代码 
要 低 效 得 多 ( 会 差 上 告 干 个 数量 级 )， 但 如 果 只 是 调用 现存 的 已 编译 模块 中 的 某 个 函数 ， 就 无 所 
请 了 (该 函数 本 续 会 以 正常 速度 执行 ) 一 一 例如 在 shell 中 执行 ]ists:reverse([1,2,3] )。 这 
时 ，shell 只 要 准备 好 列表 [1,2,3] 并 将 之 传 给 reverse 函 数 便 可 (当然 完事 儿 后 还 要 打印 结果 )。 
虽然 shell 的 速度 相对 较 慢 ， 人 也 无 法 感知 其 间 的 差别 。 

然而 ， 借 助 列 表 速 构 (参见 2.9 节 ) 或 巧妙 地 运用 匿名 递归 函数 (一 种 会 让 初学 者 绞 尽 脑汁 
的 漂亮 技巧 ) "， 仍 然 能 在 shell 中 写 出 几乎 完全 用 解释 器 执行 的 代码 ， 并 以 此 来 完成 大 量 工作 。 
这 种 做 法 的 执行 效率 显 车 低 于 放 在 模块 内 编译 执行 的 代码 。 所 以 ， 请 记 住 : 不 要 用 shell 解 释 右 来 
评测 代码 的 执行 效率 。 要 想 得 出 有 意义 的 评测 数据 , 就 必须 把 代码 写成 模块 , 而 不 是 直接 丢 到 shell 
里 。 不 要 以 shell 的 行为 为 依据 对 执行 效率 妥 下 结论 。 



































注意 DDO0000000000000sed000000000000000000000 
UDDDUDUOUDNUUUOUUUUUsheAUDDUddUUUU00UUUU0 
UUDUUUUUD 





下 到 目前 为 止 我 们 所 有 的 示例 中 部 缺少 一 样 东 西 。 发 现 了 没 ? 你 痢 还 没 用 到 过 变量 呢 ! 其 原 
在 于 变量 与 模式 匹配 密切 相关 ,我 们 想 把 它们 放 在 一 起 介绍 ,现在 你 已 经 了 解 了 基本 数据 类 型 、 
模块 ， 还 有 闻 数 ， 该 来 看 看 怎么 在 代码 中 使 用 变量 了 。 


2.4 变量 与 模式 匹配 


Erlang 的 变量 有 别 于 大 部 分 其 他 编程 语言 中 的 变量 ， 这 也 是 为 什么 我 们 二 到 现在 才 介 绍 它 。 
它们 并 不 比 其 他 语言 中 的 变量 复杂 ， 反 倒 要 简单 很 多 ! 它 甚至 简单 到 会 让 你 第 一 反应 觉得 :“ 这 
种 东西 有 什么 用 ? ” 

这 一 市 中 ， 我 们 先 介 绍 变量 、 单 次 赋值 ( single assignment ) 和 = 运算 符 的 工作 机 理 ， 再 深入 
介绍 模式 匹配 ， 同 时 展示 如 何 运 用 模式 匹配 轻松 提取 数据 结构 的 各 个 部 分 或 对 它们 做 断言 。 




















Q 这 里 讨论 的 递归 匿名 函数 问题 实际 上 就 是 YCombinator。Erlang shell 只 能 接受 表达 式 , 但 在 Erlang 中 具名 国 数 定义 
并 不 是 表达 式 ( 参见 2.5 节 )， 因 此 在 Erlang shell 中 无 法 定义 具名 困 数 ， 只 能 使 用 fun 来 定义 匿名 图 数 。 另 一 方面 ， 
在 Erlang 中 只 能 通过 递归 来 实现 循环 ,这样 就 引入 了 如 何 定义 匿名 的 递归 也 数 的 问题 。 解 法 参见 
http://stackoverflow.com/questions/867418/how-do-you-write-a-fun-thats-recursive-in-erlang。 关 于 Y Combinator 请 参见 
译 者 注 








http://en.wikipedia.org/wiki/Fixed point combinator。 
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2.4.1 变量 的 语法 


Erlang 变 量 最 显著 的 特点 就 在 于 变量 名 必须 以 大 写字 母 开 尖 ! (还 记得 吧 ? 以 小 写字 母 开 头 
的 名 字 已 经 被 用 于 原子 了 。) 以 下 是 一 些 变量 的 示例 ,变量 名 中 的 单词 以 驼峰 体 〈CamelCase ) 隔 
开 ， 这 是 Erlang 变 量 的 标准 命名 风格 : 

2 

Name 


Shoesizel2 
ThisIsARatherLongVariableName 


变量 名 也 可 以 以 下 划 线 开头 。 这 种 情况 下 ， 按 肖 规 第 二 个 子 从 通 弟 应 该 是 大 写 子 母 : 


_SomeThing 
及 


_this may look like an atom but is really a variable 

两 种 命名 方式 有 一 点 小 小 的 功能 性 区 别 : 赋值 之 后 一 直 未 被 使 用 的 变量 往往 会 触发 编译 警 
告 。 这 个 机 制 可 以 带 我 们 发 现 大 量 低级 错误 ， 所 以 不 要 关闭 这 个 警告 。 然 而 ， 如 果 使 用 某 个 变量 
的 目的 仅 在 于 提高 程序 可 读 性 ， 你 便 可 以 在 变量 名 前 加 上 一 个 下 划 线 。( 等 我 们 讲 到 模式 匹配 的 
时 候 你 便 会 明日 为 什么 要 这 样 使 用 变量 。) 这 样 一 来 即便 这 些 变量 不 被 使 用 ,， 编 详 关 也 不 会 报警 。 
同时 ,所 有 未 被 使 用 的 变量 都 会 被 优化 掉 ， 不 会 沉 来 额外 的 成 本 : 这 样 一 来 ,你 就 可 以 这 无 顾虑 
地 以 改善 可 读 性 为 日 的 使 用 它们 标注 程序 。 



































2.4.2 ” 单 次 赋值 


下 一 个 出 乎 意料 之 处 就 是 ，Erlang 的 变量 被 严格 地 限定 为 只 能 接受 单 次 赋值 。 也 就 是 说 ， 变 
量 一 旦 被 赋值 一 一 或 者 用 Erlang 界 的 话说 ， 变 量 被 绑 定 到 某 个 值 上 ， 该 变量 在 其 整个 作用 域 ( 即 
变量 在 程序 中 生效 的 范围 ) 内 便 一 直 持 有 这 个 值 。 在 程序 的 不 同位 置 可 以 重复 使 用 同一 变量 名 ， 
但 仅 限 于 互 不 上 柳 兰 的 多 个 不 同 的 作用 域内 ， 所 指 的 当然 也 是 不 同 的 变量 。( 这 就 好 像 德 元 院 斯 州 
的 巴黎 和 法 国 的 巴黎 之 间 的 区 别 一 样 )。 

在 大 多 效 其 他 编程 语言 中 , 变量 就 像 是 起 了 各 字 的 盒子 , 在 程序 中 你 随时 都 可 以 修改 盒子 里 
的 内 容 。 仔 细 想 想 ， 就 会 党 得 奇怪 ， 这 跟 你 在 代数 诗 上 学 到 的 内 容 可 不 一 样 。Erlang 的 变量 却 与 
对 应 的 数 尝 概念 相符 : 它 就 是 指 代 某 个 值 的 一 个 名 子 ， 且 这 种 指 代 关 系 不 会 背地 里 悄悄 改变 ( 否 
则 方程 可 束 解 不 出 来 了 ) 这 些 值 束 在 计算 机 内 存 中 的 某 处 , 但 Erlang 不 用 你 事 必 躬 亲 地 操心 各 种 
细 市 ， 诸 如 创建 合子 、 在 盒子 间 搬 运 东 西 ， 或 是 重复 利用 盒子 以 便 方 省 空间 。Erlang 编 译 融 会 玫 
你 搞定 一 切 ， 而 且 表 现 不 俗 。 

要 想 了 解 更 多 关于 单 次 赋值 和 引用 透明 性 概念 的 内 容 ， 请 参见 附录 B。 

1. = 运算 符 以 及 在 shell 中 使 用 变量 

Erlang 中 最 简单 的 赋值 就 是 使 用 = 运算 符 。 这 是 一 个 匹配 运算 符 ， 你 将 会 看 到 ， 它 的 能 力 可 
不 止 是 简单 的 赋值 。 但 当前 ， 请 先 在 shell 中 试 试 这 个 例子 。 
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> X = 42. 
42 

2> X. 

42 

3> X+1. 

43 

4> 


这 个 结果 应 该 跟 你 料想 的 一 样 。 但 shell 中 的 变量 还 有 点 特殊 。 它们 的 作用 域 是 “除非 我 反悔 ， 
否则 只 要 shell 还 在 跑 , 变量 就 生效 ”。 你 可 以 调用 shell 函 数 E () 来 让 shell 遗 忘 先前 绑 定 的 所 有 变量 ， 
就 像 这 样 : 

4> 工 () ， 

OK 

5S> X. 

* 1: variable 'X' is unbound 

6> X = 17. 

17 

7> XX. 

7 

8> 


可 以 看 到 ,一旦 被 遗忘 , x 束 可 以 被 用 作 其 他 用 途 了 ,要 是 还 没 遗 坪 原 值 束 尝 试 重用 会 直 么 样 呢 ? 


8> X= 101. 
** exception error: no match of right hang side value 101 
9> 


唔 ， 受 单 次 赋值 的 限制 ， 你 会 接 到 一 个 异常 。 错 误 信息 说 发 生 了 一 次 匹配 操作 *。 如 果 仍 用 X 
的 原 值 来 赋值 呢 ? 














这 回 通过 了 。 这 就 是 匹配 的 含义 ， 如 果 x 已 经 被 绑 定 到 革 个 值 ， 匹 配 运算 符 会 检查 右 侧 的 值 是 否 
与 之 相等 ( 比较 时 使 用 的 是 完全 相等 运算 符 ， 忘 了 的 话 可 以 翻阅 前 文 的 2.2.9 节 )。 要 想 在 不 影响 
其 他 shell 变 量 的 绑 定 的 前 提 下 遗忘 X， 可 以 使 用 fE(X) ， 像 这 样 : 


10> Y = 42. 

42 

11> f(x). 

OK 

12> XX. 

* 1: variable 'X' is unbound 
13> YY. 

42 ， 

工 4> 


但 请 记 住 这 只 是 shell 中 变量 作用 域 的 工作 方式 。 在 模块 内 ,作用 域 依赖 于 函数 定义 之 类 的 东 
在 作用 域 之 内 是 无 法 提前 遗忘 变量 绑 定 的 。 等 到 2.5.2 市 我 们 还 会 深入 讨论 相关 细节 。 

2. 变量 及 其 更 新 

接受 了 无 法 更 新 变量 的 值 的 事实 之 后 ， 你 多 半 会 困惑 那 到 底 该 怎么 进行 各 种 修改 呢 ? 毕竟 ， 











中 











由 并且 失 败 了 。 一 一 译 者 注 
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程序 的 任务 大 多 是 利用 原 有 数据 计算 新 数据 一 一 例如 ， 将 某 个 数 加 1。 人 简单 地 说 ， 要 想 追 踪 其 他 
值 ， 就 给 它 男 起 一 个 名 字 。 例 如 ， 假 设 变量 x 指 代 某 个 整数 ， 要 给 x 加 1 得 到 的 值 起 个 名 字 ， 就 可 
以 写作 X1 = X + 1: 








1> X= 17. 

工 7 

2> X1L = 六 + 工 . 
18 

3> 


你 也 可 以 换 用 其 他 描述 性 更 强 的 名 字 , 像 是 NewXx 或 Tncrementedx。 这 种 做 法 是 优 是 劣 , 取 
决 于 手头 代码 的 实际 情况 ( 太 长 的 名 字 也 会 有 损 可 读 性 )。 要 是 没有 起 名 字 的 灵感 ， 也 可 以 退 而 
求 其 次 ， 用 x1、X2 、X3 这 类 名 字 来 指 代 X 的 变型 。( 如 果 你 在 纳闷 怎么 处 理 循 环 中 的 变量 ， 那 还 
得 等 到 2.15 市 我 们 讨论 递归 浮 数 的 时 候 才 能 得 到 解答 。) 

在 某 些 场合 , 你 会 遇 到 大 量 基本 相同 又 有 些微 差异 的 数据 , 从 而 不 得 不 动用 大 量 不 同 的 变量 。 























有 上 自己 的 X， 并 专心 解决 整个 问题 中 的 单个 分 解 步 又。 长 远 来 看 ， 这 样 可 以 大 大 改善 代码 的 可 读 
性 和 结构 。 

变量 本 身 是 很 乏味 的 。 不 管 有 没有 单 次 赋值 的 限制 ， 每 一 种 实际 的 语言 都 支持 变量 。 变 量 的 
真正 威力 要 通过 模式 匹配 才能 体现 出 来 。 


2.4.3 ”模式 匹配 : 加 强 版 的 赋值 


模式 匹配 是 Erlang 不 可 或 缺 的 功能 。 一 旦 上 手 ， 你 就 会 恢 讶 目 己 以 前 在 没有 它 的 情况 下 都 是 
怎么 熬 过 来 的 ， 今 后 只 要 想到 要 用 不 支持 模式 匹配 的 语言 来 编程 就 会 万 分 诅 展 。( 请 相信 我 们 。) 

模式 匹配 有 如 下 重要 作用 : 

口 选 定 控制 流 分 文 ; 

口 完成 变量 赋值 ( 绑 定 ); 

口 拆 解 数据 结构 ( 选择 和 提取 各 个 组 成 部 分 )。 

现在 就 让 我 们 来 抱 容 = 运算 符 的 那些 阴暗 的 秘密 吧 。 

= 运算 符 就 是 模式 匹配 

在 前 一 六 ， 我 们 将 = 称 作 匹 配 运算 符 。 这 是 因为 它 的 功能 就 是 模式 匹配 ， 而 不 是 赋值 。 运 算 
符 的 左 侧 ， 是 一 个 模式 ; 右 侧 ， 是 一 个 普通 表达 式 。 做 匹配 运算 时 ， 首 先 计 算 右 侧 的 表达 式 ， 得 
到 一 个 值 。 接 着 拿 该 值 去 匹配 左 侧 的 模式 〈《 有 点 像 用 字符 串 去 匹配 正则 表达 式 )。 奋 模式 匹配 不 
上 ， 比 如 17 = 42 或 true = false， 则 匹配 宣告 失败 并 抛 出 一 个 原因 代码 ( reason code ) 为 
badmatch 的 异常 。 在 shell 中 ， 该 异常 体现 为 一 条 错误 信息 “no match ofright hand value ...”。 

看 匹配 成 功 , 在 左 侧 模 式 中 出 现 的 所 有 变量 都 会 与 右 侧 值 中 的 相应 组 成 部 分 绑 定 ,然后 程序 
将 继续 计算 紧 随 其 后 的 表达 式 。( 如 条 整 个 模式 仅 由 单个 变量 组 成 ， 如 X = 42， 则 该 变量 会 与 整 
个 右 侧 值 绑 定 。) 为 了 演示 这 个 过 程 ， 请 在 shell 中 做 如 下 实验 : 
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1> {A, B, C} = {11970，"RIchard" ，malel. 
{1970, "Richard'",male} 

2> A. 

1970 

3> B, 

"Richard" 

4> C. 

male 

b> 


不 难看 出 此 处 发 生 了 些 什么 。 模 式 {A, B,Cc} 与 右 侧 的 元 组 相 匹 配 ， 于 是 , 各 个 变量 分 别 与 相 
应 的 元 素 绑 定 ， 令 你 得 以 在 后 续 的 代码 中 引用 它们 。 从 单 得 不 能 再 简单 了 。 

以 下 是 男 一 种 常见 的 匹配 形式 : 

1> {rectangle, Width, Height} = {rectangle, 200, 100}. 

{rectangle,200,100} 

2> Width. 

200 

3> Height. 


100 
4> 


此 人 处， 模式 要 求 元 组 的 第 一 个 元 系 必 须 是 原子 rectangle( 用 作 标 签 )。 由 于 右 侧 元 组 中 的 第 一 
个 元 系 正 是 与 之 相 匹 配 的 原子 ， 元 组 的 元 系数 目 也 恰好 为 3 个 ， 匹 配 成 功 ， 于 是 变量 width 和 
Height 被 绑 定 。 

同一 变量 在 同一 模式 中 可 以 出 现 多 次 ， 在 要 求 两 个 字段 的 值 必须 相等 时 可 以 用 上 这 个 技巧 : 

1> {point, X, X} = {point, 2, 2}. 

{point,2,2)} 

2> XX. 


2 
3> 


如 果 对 应 的 字段 不 相等 ， 匹 配 就 会 失败 : 


1> {point, X, X} = {Point, 1, 2}. 
xx exception error: no match of right hand side value {1,2} 
2> 


由 于 单 次 赋值 的 限制 ， 不 可 能 将 1 和 2 都 赋值 给 XxX， 无 论 先 后 。 


2.4.4 ”解读 模式 


模式 与 表达 式 形态 类 似 但 能 力 却 有 限 。 其 中 只 能 包含 变量 、 笛 量 以 及 稼 量 构成 的 列表 和 元 组 
等 数据 结构 ， 运 算 符 、 函 数 调 用 、fnn 冰 数 等 都 不 行 。 但 在 此 范围 内 模式 可 以 任意 复杂 、 般 套 任 
意 多 层 。 举 个 例子 ,我 们 先 来 创建 一 个 列表 , 其 中 包含 某 系统 中 的 用 户 信息 ( 当前 仅 有 一 个 用 户 ): 


1> Users = [{person, [{name, "Martin","Logan"}, {shoe size,12}, 
{tags, [jujitsu,beer,erlangl}]1}|]. 





























I 
( Shell 会 回 显 你 刚 输 入 的 但 , 何洁 起 见 , 我 们 和 省略 了 回 显 的 内 容 。) 现在 , 我 们 来 抽取 列表 中 第 一 
个 用 户 的 某 些 特定 信息 : 
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2> | {pPersocon，[fname， ,Surname}, , {tags, Tags}|]} | | = Users. 


3> Surname. 

"Logan' 

4> Tags. 
[jujitsu,beer,erlang. 
5> 


自 完 ， 注 意 这 里 用 到 了 单 下 划 线 (_) 表示 的 省 略 模式 〈don't-carepattern )。 也 就 是 说 ， 在 模 
式 的 某 处 用 上 的 话 就 表示 你 不 关心 右 侧 相应 位 置 上 的 值 。 同 一 模式 中 可 以 多 次 出 现下 划 线 ， 如 
同 这 个 例子 一 样 ， 但 不 要 求 右 侧 相应 位 置 上 的 值 都 相等 〈 普 通 变 量 则 有 这 个 要 求 )。 省略 模式 有 
时 也 被 称 作 匿名 变量 ， 但 它们 根本 不 是 变量 ， 只 是 占 位 符 。 

其 次 ， 看 一 下 该 模式 的 最 外 层 ， 尤 其 是 = 左 侧 最 后 ， 形 如 [ ... | 1] 的 那 部 分 。 要 想 解 该 
这 个 模式 ， 请 回忆 一 下 我 们 在 2.2.10 节 对 列表 的 讨论 : 列表 由 列表 单元 构成 ， 呈 链 状 ， 单 个 列表 
单元 可 写作 [ ...|... ]。 你 可 以 把 这 些 列 表单 元 画 出 来 ， 可 以 看 到 它们 就 像 详 黎 一 样 一 层 履 
者 一 层 ， 最 中 心 是 一 个 空 表 ， 其 余 每 层 各 自 携 市 一 些 数 据 。 

于 是 ， 上 面 那 个 模式 可 以 解读 如 下 : 


它 的 最 外 层 是 列表 单元 ， 其 内 层 数 据 (模式 中 的 | _] 部 分 ) 我 不 关心 ， 但 其 携带 
的 数据 ( 模式 中 的 [ ... | 部 分 ) 应 具备 {person, [...,...,... ] } 这 样 的 结构 
即 一 个 带 person 标 记 的 二 元 组 ， 其 第 二 个 元 素 是 一 个 含有 3 个 元 素 的 列表 。 这 3 个 元 素 
中 的 第 一 个 是 带 name 标 记 的 三 元 组 ,我 需要 知道 它 的 第 三 个 元 素 的 值 一 一 我 们 将 其 命 
名 为 Surname; 第 三 个 元 素 是 一 个 带 tags 标 记 的 二 元 组 ， 我 需要 知道 它 的 第 二 个 元 素 
的 值 一 一 我 们 将 其 命名 为 Tags。 


看 明白 了 吗 ? 那 可 真是 共 喜 了 。 不 过 这 正体 现 了 模式 的 威力 , 不 到 50 个 字符 的 一 行 表达 式 便 
表达 了 如 此 长 篇 素 呈 的 业务 逻辑 〈 用 其 他 语言 来 写 的话 非 得 详 洋 洒洒 写 上 一 大 段 不 可 )。 这 便 是 
模式 的 特点 : 目 然 、 紧 次 、 易 谈 、 强 大 。 

用 ++ 完 成 字符 串 前 级 匹配 

你 应 该 还 记得 ，Erlang 的 字符 串 〈《 双 引号 内 的 字符 串 ) 就 是 学 符 编码 的 列表 。 这 就 何人 化 了 字 
从 串 的 前 级 匹配 。 先 来 看 一 个 人 简单 列表 的 前 级 匹配 的 例子 : 

[1 23 | Past] S [lr27 370d Dy G7 
由 于 左右 两 侧 的 前 3 个 元 素 相 同 ， 匹 配 得 以 成 功 。 于 是 ， 变 量 Rest 被 绑 定 到 3 之 后 的 列表 单元 : 
也 就 是 ,Rest = [4,5,6,7]。 

然而 字符 串 是 字符 编码 的 列表 ， 同 时 你 又 可 以 用 $ 语 法 得 到 学 符 的 编码 值 ( 例如 ，s$A 会 得 到 
65 )， 所 以 以 下 代码 也 次 效 : 

[Sh, St, S$t, S$Sp, $: | Rest] = "http://www.erlang.org' 

这 会 将 Rest 绑 定 到 字符 串 "/ /www.erlang .org" 上 。 效 果 不 错 ， 但 还 可 以 更 简洁 些 。 前 面 
我 们 说 过 模式 中 不 可 出 现 运算 符 。 只 有 一 个 例外 : 用 于 拼接 字符 串 的 ++ 运 算 符 。 当 上 且 仅 当 左 侧 参 
数 是 字符 串 和 常量 时 ，++ 可 以 在 模式 中 出 现 。 于 是 上 面 的 例子 就 可 以 写作 : 
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‘http://" ++ Rest = "http:/ /www.erlang,org" 
(我 们 把 两 个 和 斜 杠 也 放 到 了 模式 中 ， 这 样 Rest 就 变 成 了 "www.erlang .org"， 有 意思 吧 ? ) 整个 
过 程 一 点 儿 也 不 稀奇 。 针 对 "abc" ++ SomeString，++ 运 算 符 实际 上 构造 了 一 个 [$a, $b, $c 
| SomeSstring] 形 式 的 列表 ， 与 你 前 面 手写 的 模式 一 模 一 样 。 当 然 ， 为 了 让 编译 上 需 正 确 地 展开 
表达 式 ，++ 运 算 符 左 侧 的 参数 必须 是 一 个 编译 期 字符 串 常 量 。 

由 于 基本 字符 串 匹 配 的 简化 ， 正 则 表达 式 在 Erlang 中 并 不 多 见 。 用 正则 表达 式 实现 这 种 程度 
的 匹配 未 人 免 太 小 题 大 作 ， 并 且 还 会 市 来 额外 的 开销 。 

到 这 里 我 们 该 给 你 鼓 鼓 劲 儿 了 ， 截 至 目前 为 止 ，Erlang 中 绝 大 部 分 怪异 、 艰 深 的 内 容 你 都 已 
经 见识 了 。 诸如 原子 、 元 组 之 类 的 各 种 概念 ， 同 时 担当 着 字符 串 角 色 的 古怪 的 列表 ， 变 量 要 用 大 
写字 母 开头 而 且 只 能 赋值 一 次 ， 函 数 的 元 数 居 然 是 困 数 名 的 一 部 分 …… 好 啦 好 啦 ， 从 今 往 后 ， 就 
是 一 片 坦 途 了 。 只 要 抵御 住 第 一 轮 的 文化 冲击 ，Erlang 便 不 再 艰深 。 闲 话 少 说 ， 让 我 们 来 用 函数 
做 些 真 正 有 意思 的 事情 吧 。 


2.5 ”函数 与 子 句 


在 讲解 吨 数 之 前 一 定 要 把 各 种 基础 知识 都 讨论 清楚 才 行 ! 但 最 关键 的 还 是 要 充分 理解 变量 和 
模式 匹配 ， 只 有 这 样 你 才能 畅通 无 阻 地 稳 握 Erlang 的 图 数 。 倒 不 是 说 Erlang 的 晒 数 在 概念 上 与 其 
他 语言 有 多 大 差异 ; 只 是 Erlang 的 因数 与 模式 匹配 之 间 的 联系 十 分 密切 。 尽 管 这 种 联系 比较 直观 ， 
但 也 需要 耗费 些 精 力 才能 适应 。 

我 们 在 2.3.4 节 中 讨论 模块 时 , 你 已 经 见识 了 价 单 的 本 数 定义 。 鉴 于 你 已 经 学 会 如 何 目 己 编 写 
模块 ， 从 现在 起 ， 我 们 不 再 频 党 用 shell 来 举例 〈 不 过 你 仍然 需要 用 shell 来 编译 和 执行 代码 )。 对 
于 后 续 内 容 中 的 前 几 个 示例 ， 你 可 以 继续 使 用 先前 建立 的 模块 一 一 名 为 my_module 的 那个 一 一 将 
要 测试 的 新 郴 数 诬 加 进来 即 可 。 洽 试 调 用 函数 前 ， 记 得 先 将 图 数 名 〈 包 括 相应 的 元 数 ) 加 入 
-export([...]) 列表 并 用 c(my_module) 重新 编译 模块 。 如 果 看 到 “undefined function 
my module:xxxN "这样 的 错误 信息 , 那 八成 是 遗漏 了 上 述 步 又 中 的 某 些 环节 。 如 果 看 到 "undefined 
shell command xxx/N”， 那 是 因为 你 在 尝试 调用 师 数 时 忘 了 加 my_moaqule :前 绥 。 


















































2.5.1 带 副 作用 的 函数 : 文本 打印 


我 们 从 基本 任务 做 起 : 获取 一 些 输 入 并 将 之 打印 到 终端 。 在 Erlang 中 一 般 使 用 标准 库 函 数 
io:format(...) 来 向 标准 输出 流 写 和 人文 本。 它 要 求 两 个 参数 : 第 一 个 参数 是 格式 字符 串 , 第 二 
个 是 欲 打印 项 式 的 列表 。 你 马上 就 会 在 自己 的 另 数 print 中 用 上 它 。 你 所 要 写 的 这 个 困 数 将 接受 
一 个 变量 Term 作 为 参数 : 


print (Term) -> 











io:format ("The value of Term is: ~p.~n", [Terml]}. 
将 这 个 函数 写 人 你 的 模块 ， 在 导出 列表 中 加 入 print/1， 通 过 shell 用 c (my_module) 再 次 编 
译 模 块 ， 再 调用 my_module:print ("hello")。 你 将 看 到 如 下 信息 : 
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1> c{my module)}). 
{ok,my module} 
2> my_module:print ("hello"). 
The value of Term is: "hello". 
Ok 

了 > 


格式 字符 串 中 的 转 义 码 ~p 表 示 以 美化 方式 打印 Erlang 项 陈 。 它 会 将 可 打印 字符 列表 显示 为 双 
引号 学 符 串 ， 男 外 如 末 项 式 过 长 而 无 法 在 一 行内 完整 显示 , 便 会 分 多 行 显示 ( 并 适当 纵 进 )。 用 
你 在 2.2 节 学 到 的 各 种 数据 类 型 来 试 试 你 的 新 print 函 数 。 用 它 来 打印 列表 [65, 66,67] 会 发 生 
9 

(格式 字符 串 中 的 转 义 码 ~n 表 示 “ 插 和 人 一 个 换行 符 ”, 这 样 消息 之 后 便 会 多 出 一 个 新 行 , 不 过 
你 多 半 已 经 猜 到 了 吧 。) 

现在 如 果 将 ~p 换 成 ~w( 试 一 下 ! ) 并 重新 编 幸 ， 然 后 再 像 之 前 那样 用 my_module:print 
("hello") 调 用 该 函数 ， 你 会 看 到 

5> cflmy module)}). 

{ok,my module} 

6> my_module:print ("hello")}). 

The value of Term is: [104,101,108,108,111]. 


Ok 
了 > 


那个 难看 的 列表 是 什么 ?” 咽 , 还 记得 字符 串 就 是 字符 编码 的 列表 吧 ? 转 义 码 ~w 表 示 “ 以 原始 
形态 打印 Erlang 项 式 ”, 既 没 有 花 哨 的 换行 , 也 不 会 把 列表 打印 成 双 引 号 字符 串 ， 即便 列表 中 的 元 
素 都 是 可 打印 学 符 对 应 的 编码 也 一 样 。 

io:format(...) 拯 数 是 高 有 副作用 的 函数 的 一 个 实例 。 你 可 以 看 到 ,该 函数 会 返回 一 个 结 
采 值 (原子 'ok' ), 但 其 主要 目的 是 对 其 周遭 环境 产生 有 某 种 作用 。( 以 此 类 推 , print 函数 也 是 一 
样 的 。) 实 际 上 ,Erlang 中 的 所 有 副作用 都 可 被 视 作 消息 ( 而 且 它 们 往往 也 就 是 以 这 种 方式 实现 的 )。 
在 这 个 案例 中 ，io:format 气 数 会 完 准 备 好 要 打印 的 字符 串 ， 青 将 之 作为 消息 发 送 至 终 问 驱动 ， 
最 后 运 回 'ok'。 

最 后 ， 要 知道 你 已 经 开始 在 Erlang shell 中 进行 交互 式 开 发 了 : 修改 代码 、 重 新 编 详 并 加 载 新 
的 版 本 进行 试验 ， 整 个 过 程 和 都 无 顷 俘 止 和 重启 Erlang 环 境 。 如 采 你 的 Erlang 系 统 还 在 后 台 跑 着 其 
他 要 紧 的 东西 ( 比如 问 客 户 提 供 网 页 服务 )， 它 仍然 能 够 在 你 修 修补 补 的 同时 欢快 稳健 地 运行 。 


2.5.2 用 模式 匹配 在 多 个 子 句 中 进行 选择 


接 下 来 ,我 们 来 看 看 模式 匹配 是 怎么 摊 和 进来 的 。Erlang 的 也 数 可 以 有 多 个 子 句 。 而 上 一 市 
的 示例 中 只 包含 一 个 子 名 ， 以 下 的 示例 则 有 3 个 子 句 : 















































either or both(ltrue, ) -> 
true; 

either_ or both(_, true) -> 
true; 

either or both(false, false} -> 
false. 
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此 处 的 either_or_both/2 图 数 是 布尔 图 数 的 一 个 实例 一 一 即 专门 处 理 true 和 false 值 的 
卫 数 (它们 本 身 也 是 Erlang 的 两 个 普通 原子 ， 还 记得 吗 ? ) 正如 其 名 ， 它 应 该 具有 与 内 置 的 or 运 
算 符 相 同 的 功能 ， 当 任意 参数 或 所 有 参数 都 为 Lrue 时 ， 结 果 为 crue; 否则 结果 为 false。 同 时 
该 函数 不 接受 非 布 尔 值 参数 。” 

请 注意 子 句 由 分 号 〈; ) 分 隔 且 最 后 一 个 子 句 由 句号 (. ) 结尾 。 同 一 机 数 的 所 有 子 句 必须 具 
备 相同 的 另 数 名 和 相同 的 参数 数量 , 旦 必须 在 同一 处 定义 一 一 不 允许 在 同一 函数 的 两 个 子 句 之 间 
再 插入 其 他 也 数 定义 。 

子 句 选择 

调用 涵 数 时 ，Erlang 会 自 上 而 下 地 尝试 对 子 句 进行 模式 匹配 : 首先 ， 用 输入 参数 去 匹配 第 一 
个 子 句 中 的 模式 ; 奉 匹 配 失 败 ， 就 尝试 下 一 个 子 句 ， 以 此 类 推 。 就 这 个 示例 而 言 ， 只 要 第 一 个 参 
数 是 true， 便 会 选中 第 一 个 子 句 (第 二 个 参数 是 什么 则 无 天 紧 要 一 一 请 注意 该 示例 在 第 二 个 参 
数 的 位 置 上 用 了 一 个 省 略 模式 )。 

第 一 个 子 句 若 匹配 不 上 ， 而 第 二 个 参数 为 Lrue， 则 会 选中 示例 中 的 第 二 个 子 句 。 但 蔡 该 子 
名 也 无 法 匹配 ， 就 会 尝试 第 三 个 子 句 ， 若 仍然 匹配 不 上 上， 最终 会 抛 出 一 个 tunction_clause 类 
型 的 运行 时 异常 ， 以 示 本 次 函数 调用 的 参数 与 所 有 子 句 都 不 匹配 。 

现在 ， 我 们 再 来 看 看 这 些 子 句 ， 并 思考 你 在 每 一 步 都 笠 握 看 哪些 信息 。 咎 步 和 人 第 二 个 子 句 ， 
你 便 知 道 第 一 个 参数 肯定 不 是 true ( 否则 第 一 个 子 句 就 能 匹配 )。 与 此 类 似 ， 你 各 一 路 走 到 了 第 
三 个 子 句 ， 你 便 知道 前 两 个 参数 都 不 是 true。 此 时 ,余下 的 唯一 一 种 合法 的 组 合 便 是 两 个 参数 
都 是 false( 前 提 是 参数 只 能 取 值 为 Lrue 或 false )。 

在 良好 的 编程 实践 中 , 这 种 信息 应 该 显 式 存在 于 代码 中 一 一 这 就 是 为 什么 最 后 一 个 子 句 不 接 
受 (false，false) 以 外 的 任何 内 容 。 要 是 有 人 用 foo 或 42 等 意料 之 外 的 值 来 调用 该 也 数 ， 便 
会 得 到 一 个 运行 时 异常 ( function_clause ), 而 这 正 是 你 期 望 达到 的 效果 : 这 香味 着 这 类 错误 
调用 会 快速 崩溃 ,以 便 尽 早 地 发 现 错误 和 修正 代码 , 这 样 错误 数据 才 不 会 进一步 蔓延 到 系统 的 其 
他 部 分 。 你 硅 想 在 这 儿 充 好 人 ， 在 最 后 一 个 子 句 中 加 上 (_，_) 并 对 其 余 所 有 情况 都 返回 false， 
那么 像 either_or_both (foo，bar) 这样 的 调用 就 不 会 触发 任何 错误 警示 而 直接 返回 false。 


2.5.3 ”保护 式 


/Jw 仍 有 漏网 之 鱼 。 要 是 有 人 用 either or both(true, 42) 或 either or both 
(fo00o，true) 来 调用 前 面 的 函数 ， 它 只 会 平静 地 返回 true， 仿佛 一 切 太 平 无 事 。 你 可 以 使 用 保 
护 式 来 添加 额外 的 约束 ， 从 而 堵 住 这 个 汤 洞 : 


either or both(ltrue, B})} when is boolean(B} 一 > 






























































true; 

either or _ both(A, true) when is boolean{A}) -> 
true; 

either or both(lfalse, false} 一 > 
false. 


QD 此 处 “不 接受 非 布 尔 值 参数 ”的 说 法 实际 上 是 有 问题 的 ， 作 者 将 这 个 问题 留 到 了 2.5.3 节 去 解决 。 一 一 译 者 注 
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子 句 保护 式 由 关键 字 when 开 始 到 -> 箭头 结束 。 其 中 可 以 包含 一 个 或 多 个 由 逗号 分 阳 的 判定 ， 
仅 当 所 有 判定 都 为 true 时 该 子 句 才 会 被 选中 。 可 以 看 到 ， 现 在 你 需要 在 模式 中 引入 变量 ， 以 便 
在 保护 式 中 对 它们 进行 引用 ， 所 以 这 个 示例 用 变量 名 A 和 B 取 代 了 和 省略 模 式 。is_boolean(...) 
判定 是 内 置 函数 之 一 ， 因 此 你 不 必 指 定 模 块 名 ( 内 置 哨 数 都 位 于 erlang 模 块 中 )。 所 有 基本 数据 类 
型 都 有 相似 的 判定 图 数 : is_atom(...)、is_integer(...) 等 。is_boolean(...) 判 定 困 数 
用 于 检查 参数 值 是 否 为 原子 true 或 false。 

包括 此 类 类 型 判定 在 内 ,能 用 在 保护 式 中 的 操作 是 十 分 有 限 的 。 大 部 分 运算 符 都 可 以 用 (+、 
-、*、/、++ 等 )， 部 分 内 置 函 数 也 可 以 用 (比如 self () )， 但 你 不 能 调用 目 定 义 的 困 数 或 其 他 
模块 中 的 函数 。 原因 部 分 在 于 效 认 一 一 子 句 选择 必须 足够 快 , 但 更 主要 的 是 这 些 函 数 可 能 帘 有 副 
作用 。 重 要 的 是 ， 某 个 保护 式 失 败 后 ( 被 判 为 false )， 必 须 能 够 若无其事 地 继续 尝试 下 一 个 子 
句 。 例 如 ， 假 设 你 通过 某 种 方式 在 某 个 保护 式 中 发 送 了 一 条 消息 ， 但 这 个 保护 式 却 被 判 为 失败 ， 
你 是 无 法 撤销 这 条 消息 的 一 一 可 能 已 经 有 人 收 到 这 条 消息 并 继而 做 出 了 一 些 外 界 可 见 的 操作 , 比 
如 修改 了 某 个 文件 或 打印 了 某 些 文本 。Erlang 不 允许 此 类 情况 发 生 ， 这 使 得 保护 式 ( 以 及 子 句 ) 
更 易于 推导 、 重 排 和 重 构 。 

请 务必 将 该 函数 加 入 你 的 模块 做 做 实验 ， 先 用 第 一 个 版 本 ,然后 再 试 试 带 保护 式 的 那个 。 用 
不 同 的 输入 来 检验 它们 的 行为 。 我 们 希望 你 能 明日 , 这 种 在 不 重启 运行 时 系统 的 前 提 下 便 可 以 对 
Erlang 据 数 进行 实验 的 能 力 ， 这 种 交互 式 测试 和 淘 进 式 修改 的 能 力 ， 可 以 极 大 地 提升 生产 力 和 创 
造 力 。 


2.5.4 ”模式 、 子 名 和 变量 作用 域 


我 们 再 举 一 个 模式 匹配 的 例子, 展示 如 何在 选择 子 句 的 同时 提取 出 感 兴趣 的 数据 。 以 下 的 项 
数 假设 你 正 使 用 标记 元 组 来 表示 各 种 几何 图 形 的 信息 : 
area(l({circle, Radius}) -> 
Radius * Radius * math:pi{):; 
areal({square, Side}) -> 
Slide * Side; 
area({rectangle, Height, Width}) -> 
Height * Width. 






































例如 ,你 硅 发 起 调用 my_module:area({square,，5}), 便 会 得 到 25。, 你 寿 传 人 {rectangle,， 





3，4}， 它 便 返 回 12， 以 此 类 推 。 模 式 匹 配 决 定 该 选择 哪个 子 名 ,但 与 此 同时 它 也 将 变量 绑 定 到 
了 数据 结构 中 的 元 素 上 ， 以 便 各 个 子 句 的 函数 体能 够 引用 这 些 值 。 请 注意 与 早先 的 
either_or_both 辆 数 不 同 ， 该 函数 各 子 句 的 顺序 无 关 紧 要 ， 因为 每 次 仪 能 匹配 上 一 个 子 句 ; 
们 是 互 斥 的 。 

绑 定 于 困 数 子 句 首部 的 变量 的 作用 域 〈 或 生存 期 ) 过 布 整个 子 名 ,一生 到 该 子 句 末尾 的 分 号 
或 句号 。 例 如， 在 area 函 数 中 ， 你 用 不 同 的 变量 名 来 指 代 圆 的 半径 (Radius ) 和 正方 形 的 边 长 
(side )， 但 你 乐意 的 话 也 可 以 管 它们 都 叫 XZ， 因 为 它们 分 属 不 同 的 子 句 。 另 一 方面 ,矩形 的 高 度 
(Height ) 和 宽度 (width ) 就 必须 采用 不 同 的 变量 名 ， 因 为 它们 的 作用 域 重 合 。Erlang 的 变量 
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是 无 须 声 明 的 一 一 按 需 取 用 便 可 ; 但 这 也 要 求 同 一 子 句 内 的 变量 不 能 重 名 。 
当 变 量 的 作用 域 结束 时 ， 对 应 的 值 奉 未 被 程序 的 其 他 部 分 用 到 ， 便 会 被 标 为 垃圾 ， 等 竺 垃圾 
回收 融 回 收 。 在 Erlang 中 这 也 是 件 无 顷 费 心 的 事 儿 。 


2.6 case 和 if 表达 式 


要 是 Erlang 中 只 有 也 数 子 句 这 一 种 控制 流 分 文 方法 ， 你 就 必须 为 程序 中 的 每 个 小 小 的 分 文选 
择 都 取 一 个 浮 数 名 。 虽 人 然 理 论 上 没什么 问题 ， 但 这 种 做 法 末 人 免 也 太 烦 人 人 了。 至 运 的 是 ，Erlang 专 
门 提 供 了 针对 这 种 情况 的 case 表 达 式 。 这 些 表 达 式 同样 可 以 有 多 个 子 句 ， 但 每 个 子 句 只 能 有 一 
个 模式 ( 所 以 无 须 插 号 )。 

例如 ，2.5.4 广 的 area 函 数 也 可 以 用 case 表 达 式 来 写 : 


arealSshape) -> 
case Shape of 

{circle, Radius} -> 
Radius * Radius * math:pi{}:; 

{square, Side} -> 
Side * Side:; 

{rectangle, Height, Width} -> 
Height * Width 





end. 

请 注意 你 必须 得 给 area 的 输入 参数 一 个 名 字 ， 这 样 才能 在 后 续 的 分 文 判 断 中 引用 该 参数 的 
值 (case Shape of ...)。 同 时 请 注意 所 有 的 子 句 都 以 分 号 分 隅 ， 这 点 和 困 数 子 句 一 样 ， 另 
外 整个 case 表 达 式 必须 以 关键 子 end 结 尾 。( 最 后 一 个 子 句 之 后 没有 分 号 一 一 分 号 是 分 隅 和 从, 不 
是 结束 符 。) 在 这 个 案例 中 ， 由 于 引入 了 额外 的 变量 以 及 case/of/end 关 键 字 ， 新 水 数 的 可 读 
性 可 能 反而 有 所 降低 ， 大 部 分 Erlang 程 序 员 还 是 更 倾 问 于 早先 厂 本 的 写法 〈 即 便 要 把 函数 名 重复 
3 通 )。 

当 你 想 在 case 表 达 式 中 针对 多 个 项 式 进 行 分 文选 择 时 ， 你 必须 用 元 组 标记 将 它们 组 合 起 来 。 
例如 ，2.$.3 和 的 either_or_both 图 数 可 以 写成 ， 


either or both(A, B} 一 > 
case {A, B} of 





























{true, B} when 1is boolean(B) -> 
true; 

{A, true} when is boolean{(A) -> 
true; si 


{false, false} 一 > 
false 
engd. 


可 以 看 到 ， 在 case 表 达 式 中 也 可 以 使 用 保护 式 ( when ... )。 同样 ， 你 也 可 以 选用 该 限 数 
先前 的 更 简明 的 版 本 。 





2.6.1 Erlang 的 布尔 型 tf-then-else 分 文选 择 


大 吃 一 慰 吧 : 根本 没有 这 种 玩意 儿 ! 你 可 以 用 case 表 达 式 来 蔡 代 ， 如 下 : 
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Case either or both(x, Y) of 
true -> io:format ("yes~n"}.: 
false -> io:format ("no~n’') 

end 


尽管 在 最 后 一 个 分 支 中 可 以 拿 下 划 线 用 作 通 配 模 式 ， 不 要 这 么 做 ,分 别 在 两 个 分 支 中 写 明 
true 和 false。 当 分 支 选 择 的 输入 碰巧 是 true/ false 之 外 的 值 时 , 这 样 做 可 以 确保 你 的 程序 尽 
时 报错， 同时 Dialyzer 这 类 程序 分 析 工 具 也 可 以 更 明了 你 的 意图 。 








2.6.2 IE 表达 式 


作为 特例 ，if 表 达 式 是 case 表 达 式 的 一 种 缩 略 形式 ， 它 不 针对 特定 的 值 做 分 文 判断 也 不 含 
模式 。 当 你 仅 依赖 保护 式 进行 子 句 选择 时 ， 就 可 以 使 用 if 表达 式 。 例 如 : 
Sign{(N) when is number{N) 一 > 
if 
N> 0 -> positive; 
N< 0 -> negative; 





本 Yue -> Zero 
end. 
这 段 逻 辑 也 可 以 用 带 占 位 符 的 case( 同时 在 所 有 子 句 中 应 用 省 略 模 式 ) 来 写 : 
Sign{(N)} when is number (NM) -> 


case dummy of 
when N> 0 -> positive; 
_ when N < 0 -> negative; 
_ when true -> Zero 

end. 


通过 这 个 示例 我 们 希望 你 能 明白 为 何 i£f 表 达 式 最 后 的 通 配 子 句 ( catch-all clause ) 要 写成 true 
-> ...。 只 要 保护 式 判 定 为 真 ， 子 句 就 总 能 匹配 。 

If 表 达 式 很 久 以 前 就 被 加 到 Erlang 语 言 中 了 ， 坦 日 说 这 一 设计 相当 随意 。 它 们 并 不 第 用 ， 因 
为 大 部 分 分 支 判 断 痢 或 多 或 少 地 依赖 于 模式 匹配 。 虽然 它们 在 少数 场合 很 好 用 , 但 Erlang 程 序 员 
长 久 以 来 一 直 埋 人 怨 该 表达 式 是 对 if 关 键 字 的 浪费 。 作 为 初学 者 ， 你 只 要 记 住 分 支 判 断 的 条 件 并 
非 普 通 表 达 式 一 一 它们 是 保护 式 判 定 ， 因 而 能 力 有 限 (参见 2.5.3 市 )。 

















2.7 fun 函数 

我 们 曾 在 2.2.8 节 简要 介绍 过 fun 函 数 。 然 而 只 有 现在 ， 在 我 们 介绍 完 函 数 和 子 名 之后， 我 们 
才能 详细 讨论 如 何 创 建 fun 函 数 。 
2.7.1 作为 现 有 函数 别名 的 fun 函 效 


硅 要 引用 当前 模块 内 的 某 个 函数 比如 either_or_pboth/2 一 一 并 告知 程序 的 其 他 部 分 : 
“请 调用 这 个 也 数 ”"。 那 么 你 可 以 创建 一 个 这 样 的 fun 消 数 : 


fun either or both/2 
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和 各 种 其 他 类型 的 值 一 样 ， 你 可 以 将 之 与 变量 绑 定 
F = fun either or both/2 
或 下 接 将 之 传递 给 别 的 函数 : 
yesno(fun either or both/2) 
对 于 来 目 别处 的 fn 函数 ， 你 可 以 像 调用 任意 普通 函数 一 样 来 调用 它 ， 如 : 


Yesno (F} -> 
case F(true, false}) of 








true -> lio:format ("yes~n"}.; 
false -> lio:format ("no~n") 
end. 


这 样 一 来 ， 程 序 的 行为 也 可 以 简单 地 参数 化 。 随 给 定 的 fun 函 数 的 不 同 ， 同 一 函数 (yesno ) 可 
以 发 挥 不 同 的 作用 。 在 这 个 示例 中 ， 输 入 参数 F 必 须 是 一 个 函数 ， 同 时 它 要 能 接受 两 个 布尔 参数 
并 返回 一 个 用 于 条 件 判断 的 布尔 值 ， 除 了 这 些 限 制 之 外 ， 它 无 所 不 能 。 





高 阶 函 数 

上 述 示例 中 的 yesno/1 函数 就 是 所 谓 的 高 阶 函 数 : 以 fun 函数 为 输入 ， 或 以 fun 函数 为 
输出 ， 或 兼 而 有 之 。fun 函数 和 高 阶 函 数 非常 有 用 ; 面向 对 象 语言 中 的 各 种 代理 、 适 配器 、 爷 
令 、 策 略 等 模式 都 可 以 用 它们 来 实现 。 





请 注意 ， 这 些 本 地 别名 fun 辆 数 与 匿名 fan 因数 (即将 阐述 ) 在 实现 上 很 类 似 ， 它 们 都 依赖 于 
模块 的 当前 版 本 。 详 情 参见 下 一 节 中 的 “本 地 fon 曙 数 短暂 的 有 效 期 ”。 

远程 别名 fun 函 数 

如 果 要 引用 位 于 其 他 模块 中 的 郴 数 ， 可 以 采用 以 下 语法 来 创建 fn 因数 (对 同一 模块 内 的 导 
出 函数 同样 有 效 ): 

fun other module:some_ function/2 

远程 别名 fun 哨 数 在 代码 加 载 方面 有 关 不 同 的 行为 :它们 不 依赖 于 被 引用 子 数 的 特定 版 本 。 
相反 ， 在 被 调用 时 ， 它 们 总 是 指 癌 被 引用 函数 的 最 新 版 本 。 这 些 fun 也 数 类 型 的 值 仅 仅 是 函数 的 
符号 引用 ， 因 此 可 以 被 长 期 存储 并 /或 毫 无 障碍 地 在 Erlang 系 统 间 传递 。 

















2.7.2 ”匿名 fun 函 数 


忌 管 被 用 作 别 名 时 fan 函数 很 有 用 ， 但 它 真 正 的 威力 却 在 于 匿名 fan 函数 ， 也 就 是 所 谓 的 
Lambda 表 达 式 。 如 同上 一 节 中 的 fun 函 数 ， 它 们 以 fun 关 键 字 开头 ; 同时 ， 如 同 case 表 达 式 ， 它 
们 也 以 end 关 键 字 结 束 。 位 于 这 两 个 关键 字 之 间 ， 是 一 个 或 多 个 不 带 困 数 名 的 图 数 子 句 。 例 如 ， 
以 下 是 一 个 最 简单 的 匿名 困 数 。 它 不 接受 任何 参数 且 总 是 返回 零 : 

| 


再 来 看 个 复杂 点 儿 的 冰 数 一 一 其 功能 与 2.$.4 节 中 的 area 困 数 一 致 ， 只 是 没有 函数 名 : 
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fun ({circle, Radius}} -> 
Radius * Radius * math:p1i{); 
{({square, Side}) -> 
Side * Side; 


{({rectangle, Height, Width}) 一 > 
Height * Width 
end 


显然 ， 匿 名 fun 晒 数 要 发 挥 作 用 ， 就 必须 与 变量 绑 定 ， 或 者 作为 参数 被 传 给 其 他 因数 ， 正 如 
2.7.1 市 中 的 yesno/1 消 数 : 


yesno(l fun (A, B) -> A orB end, 


本 地 fun 函数 短暂 的 有 效 期 

匿名 fun 函数 以 及 用 作 本 地 函数 别名 的 fun 函数， 都 依赖 于 代码 的 特定 版 本 。 这 些 fun 函 
数 在 所 属 模块 重新 加 载 一 次 以 上 之 后 便 会 失效 :再 有 人 企图 调用 它 的 话 , 它 便 会 抛 出 一 个 异常 。 
因此 ， 这 些 fun 函数 值 不 适合 长 期 保存 (例如 将 它们 存 入 数据 库 )。 此 外 ， 你 车 将 它们 以 消息 
的 形式 发 给 别 的 Erlang 系统 ， 则 接收 方 必 须 持 有 相同 版 本 的 代码 才能 顺利 调用 这 些 fun 函数 。 
在 这 种 场景 下 应 该 使 用 远程 别名 。 


闭 包 

术语 闭 包 与 fun 函 数 或 Lambda 表 达 式 往往 可 以 互 换 使 用 , 但 闭 包 一 般 特 指 fun. . .end 的 内 部 
引用 了 ， 在 fun 函 数 外 部 绑 定 的 变量 的 情况 。fon 函 数 能 将 那些 变量 当前 的 值 封存 起 来 。 这 种 用 法 
非常 常见 ， 而 且 很 有 用 。 

说 得 具体 一 点 , 假设 有 一 个 列表 ,其 元 素 是 成 对 的 字符 串 ， 每 对 字符 串 表示 一 个 名 称 以 及 对 
该 名 称 的 说 明 。 另 外 还 有 一 个 前 数 to_phtml (源码 不 在 此 列 出 )， 用 于 将 这 些 字符 串 组 装 成 定义 
列表 之 类 的 HTML 片段 一 一 具体 做 法 不 限 。 另 外 ,针对 每 个 名 称 串 ,但 不 针对 描述 串 ，to_html 
还 会 调用 一 个 由 你 指定 的 回调 函数 ， 你 可 以 在 该 函数 中 给 名 称 串 加 上 目 定 义 的 额外 标记 以 示 强 
调 。 该 回调 孔 数 在 to_html 完 成 字符 串 的 HTML 转 义工 作 之 后 才 会 执行 ， 因 此 你 不 用 关心 转 义 
之 类 的 细 市 。 

于 是 ， 你 可 以 通过 以 下 手法 将 名 称 加 粗 : 

to_ html (Items, fun {Text) -> "<b>" ++ Text ++ "</b>" eng) 

请 注意 此 处 的 Text 是 fun 函 数 的 参数 ， 代 表 的 是 co_html 每 次 执行 回调 时 传人 的 经 过 转 义 的 
字符 串 。 例 如 ， 当 Items 的 值 为 [{"D&D"，"Dungeons and Dragons"}] 时 ,输出 如 下 .: 




















. <b>D&amp;D</b> ... Dungeons angd Dragons ... 
(根据 to_html 的 具体 功能 的 不 同 ， 其 余 的 HTML 标 记 可 以 是 任意 内 容 : 定义 列表 、 表 格 、 一 堆 
diyv ? 诸如 此 类 O ) 
现在 , 假设 你 想 将 用 于 表示 强调 的 HTML 标 记 也 参数 化 : 以 变量 的 形式 让 程序 从 其 他 位 置 传 
人 ， 然 后 在 fun 哺 数 中 使 用 该 变量 : 
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renderl(Items, Em}) 一 > 
to html (Items, 
fun {Text) -> 


He 二 + ER 二 二 ">" 十 十 Text 十 十 "</" 二 十 Em ++ ">" 


end)}). 

这 个 fun 函 数 用 到 了 在 fan 函数 外 部 绑 定 的 变量 ( 这 里 是 Em )， 它 给 这 些 变量 当前 的 值 做 了 一 个 快 
照 并 封存 起 来 一 一 这 便 是 闭 包 一 词 的 由 来 。 

Erlang 的 单 次 赋值 与 引用 透明 属性 可 以 保证 这 些 值 不 被 任何 人 修改 ， 于 是 你 知道 ， 无 论 什 么 
时 候 调 用 这 个 fun 函 数 ， 它 所 持 有 的 那些 变量 的 值 都 与 它 被 创建 的 那个 时 刻 保 持 一 致 。( 当然 ,你 
可 以 针对 同一 个 fn 函数 创建 多 个 实例 ， 分 别 引 用 不 同 的 外 部 绑 定 变量 ， 但 每 个 实例 在 其 生存 期 
都 是 完全 独立 的 。) 

上 述 的 这 个 fun 函 数 是 三 种 不 同 信息 源 的 交汇 点 : rendqez 的 调用 者 ， 用 于 指定 用 在 名 称 串 
上 的 标记 应 该 是 "b" 还 是 "i"， 还 是 别 的 东西 ; to_htm1l 函 数 ， 用 于 完成 将 条 目 转换 为 HITML 的 
主体 工作 ; 还 有 rendqer 国 数 ， 用 于 指定 如 何 添加 额外 的 标记 (也 就 是 回调 吨 数 所 做 的 事情 )。 
注意 to_html 困 数 要求 回 调 男 数 接受 一 个 字符 串 参 数 。 回调 函数 的 接口 同时 也 是 to_html 接 口 的 


一 部 分 。 

















2.8 异 单 与 try/catch 





前 面 我 们 曾经 提 到 过 异常 , 但 没有 深入 解释 。 那 么 ,， 寞 帝 到 确 是 什么 呢 ? 你 可 以 将 之 认为 是 
为 数 的 另 一 种 返回 形式 ， 区 别 在 于 它 不 仅 会 返回 至 调用 者 ， 还 会 返回 至 调用 者 的 调用 着 ， 并 一 路 
问 上 ， 直 至 被 捕获 或 抵达 进程 调用 的 起 点 〈 这 时 进程 便 会 朋 溃 ) 为 止 。 
Erlang 的 异常 分 为 二 类 。 
UD error 这 类 是 
等 情况 时 触发 。 这 
便 会 将 之 记录 在 案 。 
口 sxit 一 一 这 类 异 背 用 于 通报 “进程 即将 停止 ”。 它们 会 在 迫使 进程 月 尝 的 同时 将 进程 退出 
的 原因 告知 给 其 他 进程 ， 因 此 一 般 不 捕获 这 类 异常 。exit 也 在 进程 正常 终止 时 使 用 ， 这 
时 它 会 令 进 程 退出 并 通报 “任务 结束 , 一 切 正常 ”。 无 论 是 哪 种 情况 ， 进 程 因 exit 而 终止 
都 不 算是 意外 事件 ， 因 而 也 不 会 被 汇报 至 错误 日 志 管 理 币 。 
口 throw 一 一 这 类 寞 第 用 于 处 理 用 户 目 定义 的 情况 。 你 可 以 用 throw 来 通报 你 的 函数 章 遇 了 
某 种 意外 ( 比如 文件 不 存在 或 遇 到 了 非法 输入 )， 也 可 以 用 它 来 完成 所 谓 的 非 局 部 返回 或 
是 用 于 跳出 深层 递归 。 如 果 进 程 没 能 捕获 throw 异 常 , 它 便 会 转变 为 一 个 原因 为 nocatch 
的 erzor 异 稼 ， 迫 使 进程 终止 并 记录 日 志 。 


2.8.1 抛 出 〈 触 发 ) 异常 
针对 每 种 异常 ， 都 有 一 个 与 之 对 应 的 用 于 抛 出 (或 触发 ) 异常 的 内 置 函 数 : 








运 
此 














行 时 异常 , 在 发 生 除 零 错 误 、 匹 配 运算 失败 、 找 不 到 匹配 的 函数 子 名 
异常 的 特点 在 于 一 旦 它们 促使 某 个 进程 崩溃 ，Erlang 错 误 日 志 管理 器 
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throw (SomeTerm) 
exit (Reason,) 
erlang:error (Reason) 


throw 和 和 exit 都 是 和 常用 水 数 ， 因 此 会 被 目 动 导入 : 调用 时 无 须 加 erlang :前 级 。 通常 你 不 需 
要 在 代码 中 抛 出 error 类 异常 (但 在 编写 库 时 ， 适时 抛 出 padarg 之 类 的 异 弟 却 是 个 好 习惯 ， 正 
如 Erlang 标 准 库 中 的 函数 一 样 )。 

作为 特例 ， 进 程 调用 exit (normal) 所 抛 出 的 异常 不 会 被 捕获 ， 该 进程 会 像 完 成 使 命 后 寿 终 
正 洲 一 样 终 止 。 这 意味 着 其 他 ( 与 之 链接 的 ) 进程 不 会 将 之 视 作 反 第 的 终止 行为 (其 余 所 有 的 退 
出 原因 都 会 被 视 作 反 常 )。 

















2.8.2 运用 try.. .catch 


在 现代 Erlang 中 ， 你 可 以 用 try 表 达 式 来 处 理 某 段 代码 中 发 生 的 异 浓 。 大 部 分 情况 下 ， 它 与 
case 表 达 式 类 似 ， 其 最 简 形 式 为 : 


try 
some unsafe functiont() 

catch 
OOPS -> got throw_ oops; 
throw:Other -> {got _ throw, Other}:; 
exit:Reason -> {got exit, Reason},， 


error:Reason -> {got error, Reason} 
end 


位 于 try 和 catch 之 间 的 是 正文 (body ) 或 保护 区 ( protected section )。 在 正文 内 抛 出 并 试图 
传播 出 去 的 任何 异常 都 会 被 捕获 并 与 catch 和 end 之 间 列 出 的 子 句 做 匹配 。 如 果 没 有 匹配 的 子 句 ， 
那么 该 异常 会 继续 传播 ， 就 好 像 正文 外 围 根 本 没有 过 try 表 达 式 。 与 此 类 似 ， 如 果 正 文 在 求 值 过 
程 中 没有 触发 任何 异常 ， 则 正文 的 结 采 也 就 是 整个 表达 式 的 结果 ， 就 好 像 try 和 catch. . .end 
根本 不 存在 。 唯 一 的 区 别 在 于 , 一 旦 异常 发 生 且 能 够 与 某 个 子 句 相 匹 配 , 该 子 句 的 结果 便 会 成 为 
整个 表达 式 的 结果 。 

这 些 子 句 的 模式 有 些 特殊 一 一 它们 可 以 用 冒号 ( : ) 作 为 异常 的 类 别 ( error、exit 或 throw ) 
和 被 抛 出 的 项 式 的 分 阳 和 从 。 如 果 省 略 类 别 ， 则 默认 为 throw。 一 般 情 况 下 不 应 该 去 捕获 error 和 和 
exit， 除 非 你 明确 知道 日 己 在 做 什么 。 这 种 做 法 违背 了 速 错 的 理念 ， 还 有 可 能 掩盖 真正 的 症结 。 
某 些 情况 下 , 你 需要 运行 一 些 不 那么 可 信 的 代码 并 捕获 从 中 抛 出 的 所 有 东西 。 这 时 你 可 以 使 用 以 
下 模式 来 捕获 所 有 异 租 : 


-> got some exception 









































(需要 检查 异常 中 的 数据 的 话 ， 可 以 使 用 class:Term -> ...。) 
男 外 ， 需要 注意 的 是 -日 进入 catch 部 分 ， 代码 就 不 再 受到 保护 。 catch 子 句 中 抛 出 的 新 的 
异常 ， 会 传播 到 try 表 达 式 之 外 。 








2.8.3 try...of...catch 


当 你 需要 区 分 正常 情况 和 异 第 情况 并 做 出 不 同 的 人 处理 时 ， 可 以 使 用 try 的 复杂 形式 。 例 如 ， 
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如 果 你 想 在 正常 情况 下 继续 处 理 表 达 式 的 结果 值 , 但 在 异常 情况 下 打 纯 一 条 错误 信息 并 退出 ,于 
么 你 可 以 增加 一 个 of . . . 段 ， 如 : 


try 





some unsafe function(...) 

of 
0 -> io:format ("nothing to do~n"”): 
N -> do_something_with (N) 

catch 

-> io:format (some problem~n’"} 


end 

求 值 成 功 后 你 所 要 做 的 第 一 件 事 ( 除了 给 求 值 结果 命名 ) 一 般 都 是 以 求 值 结果 为 条 件 做 分 文 
判断 ， 你 可 以 像 在 case 表 达 式 中 那样 在 of 和 catch 之 间 写 上 一 个 或 多 个 子 句 ， 用 于 人 处理 
try... of 部 分 求 值 成 功 后 的 逻辑 。 但 要 注意 | 部 分 和 catch 部 分 一 样 ， 是 不 在 保护 范围 
内 的 一 一 当前 的 try 表 达 式 无 法 捕获 这 里 发 生 的 寞 第 。 














2.8.4 after 


最 后 ， 你 还 可 以 给 任意 try 表 达 式 加 上 一 个 after 段 。 其 作用 在 于 确保 某 段 具有 副作用 的 代 
码 的 执行 。 在 你 离开 try 表 达 式 之 前 ， 无 论 表 达 式 的 其 余部 分 发 生 了 什么 ，after 段 的 代码 都 会 
说 执行 。 这 种 机 制 通 常用 于 完成 各 种 形式 的 资源 释放 一 一 例如 ， 在 以 下 这 个 示例 中 是 确保 某 文件 
的 关闭 : 

{ok, FileHandle} = file:open({'"'foo.txt'", [read])}), 

try 

do_something_with file{rFileHandle) 
after 


fijle:close (FileHandle) 
end 


此 处 ， 如 有 末 {ok,FileHandlej=:.:. .匹配 成 功 ， 就 表示 文件 已 经 成 功 打 开 。 随 后 便 进 入 try 表 达 
式 ， 其 中 的 after 有 段 会 确保 文件 关闭 ， 即 便 发 生 异 党 也 没关系 。 

注意 ， 有 了 after，catch 部 分 就 不 必要 了 ( 当然 你 可 以 加 上 ，of 部 分 也 一 样 )。 无 论 哪 种 
情况 下 ,只 有 整个 try 表 达 式 全 部 就 绪 之 后 after 部 分 的 代码 才 会 执行 ， 这 里 所 谓 的 就 绪 也 包括 
从 of 部 分 或 catcph 的 某 个 子 句 中 又 抛 出 新 的 异常 的 情况 。 夯 确实 抛 出 了 新 的 异常 , 该 异 浓 会 被 暂 
时 挂 起 ， 下 到 after 部 分 执行 完毕 后 再 被 重新 抛 出 。 如 果 after 部 分 又 抛 出 异常 ， 抛 出 的 异常 便 
会 取代 之 前 的 寞 第 ， 而 原先 被 挂 起 的 异常 则 会 被 丢 弃 。 














2.8.5 ”获取 栈 轨 还 


通常 ,你 所 见 到 的 异常 并 不 包含 执行 栈 的 轨迹 ,， 它 被 存储 于 内 部 。 你 可 以 通过 调用 内 置 也 数 
erlang:get_stacktrace() 来 查看 当前 进程 最 近 抛 出 的 异 稼 的 栈 轨迹 。 

迹 (stack trace ) 是 异常 发 生 那 一 刻 位 于 栈 的 顶部 的 那些 调用 的 逆序 列表 (最 后 一 个 调 

用 位 于 最 前 )。 每 个 函数 都 被 表示 成 {Module，Function，Args} 的 形式 ， 其 中 Module 和 

Function 都 是 原子 ，Args 要 么 是 水 数 的 元 数 ， 要么 是 也 数 被 调用 时 的 参数 列表 ， 这 取决 于 当时 
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的 可 用 信息 的 情况 。 一 般 来 说 ， 只 能 看 到 最 顶层 调用 的 参数 列表 。 
注意 ,如果 调 用 erlang:get_stacktrace() 后 得 到 一 个 空 表 , 就 表示 直至 目前 为 止 该 进程 
尚未 捕获 任何 异常 。 


2.8.6 重 抛 异常 


有 时 你 可 能 需要 进一步 检查 异 肖 之 后 才能 判断 是 否 进 行 捕捉 。 尺 省 不 太 和 党 用, 但 必要 的 话 你 
人 确实 可 以 先 捕 获 异 常 ， 再 通过 内 置 图 数 srlang:traise(Class，Reason，Stacktrace) 重 新 
将 之 抛 出 。 此 处 的 class 必 须 是 error 、exit 或 throw ，Stacktrace 则 应 该 来 目 
erlang:get_stacktrace()。 例如 : 














try 
do_ something!{) 
catch 
Class:Reason -> 
Trace = erlang:iget stacktrace(}), 
Case analyze exc (Class, Reason}) of 
true -> handle exc (Class, Reason, Trace}.: 
false ->erlanc-raiselclass, Reason, Trace,) 
end 
engd 


在 这 段 代 码 中 ,你 可 以 捕获 任何 寞 第 ,对 其 进行 分 析 ， 再 决定 是 日 行 处 理 还 是 重新 抛 出 。 然 
而 ， 这 种 做 法 既 埃 琐 又 低 效 《因为 需要 将 栈 轨 迹 转 换 成 竺 吕 化 的 元 组 列表 )， 只 能 用 在 万 不 得 已 
的 时 候 。 


2.8.7 ”传统 的 catch 


早 在 try 表 达 式 进入 Erlang 之 前 ,catch 就 已 经 存在 了 ,作为 当时 唯一 的 异常 处 理 机 制 ,catch 
在 老 代码 中 很 常见 。 它 是 这 么 用 的 : catch Expression 对 Expression 求 值 ， 若 能 够 得 出 结 
( 即 不 抛 出 异常 ), 便 以 此 为 结果 。 否 则 ， 寿 发 生 异 常 ， 便 将 之 捕获 并 作为 catch 的 结果 ， 结 果 的 
格式 根据 异常 类 别 的 不 同 而 不 同 。 以 下 的 shell 交 互 过 程 演示 了 多 种 不 同情 况 : 

1> catch 2+2. 

4 

2> catch throw!(foo). 

foo 

3> catch exit (foo}). 

{ "EXTT ,TO00} 

4> catch foo=bar. 

{ EXTITI {{badmatch, bar}, [{erl] eval, expr,3}]}} 


傈 而 言 之 , 对 于 throw, 得 到 的 结果 就 是 被 抛 出 的 项 式 ; 对 于 exit, 得 到 的 是 包含 退出 原因 
的 标记 元 组 ( 'EXIT' 是 一 个 全 部 大 写 的 原子 ， 一 般 不 容易 误 用 ); 而 对 于 error， 得 到 的 是 一 个 
包含 异常 本 里 和 栈 轨迹 的 标记 元 组 。 这 种 设计 看 似 简 单 , 但 实际 上 却 把 事情 复杂 化 了 , 使 我 们 难 
以 甚至 无 法 准确 判定 到 压 发 生 了 什么 以 及 如 何 进 行 后 续 处 理 。 你 应 该 避免 使 用 传统 的 catcn, 在 
老 代 人 码 中 碰 到 它 时 能 够 理解 得 了 就 可 以 了 。 
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2.9 ”列表 速 构 


速 构 是 一 种 用 于 描述 作用 于 集合 或 元 素 序 列 ( 如 列表 ) 上 的 运算 的 紧凑 记 法 。 你 很 可 能 早已 
在 常见 的 描述 集合 的 数学 语言 中 见识 过 它 了 ， 比 如 ，{ x | xe N,x>0} 便 是 一 个 例子 ， 它 可 以 解 
读 为 “所 有 属于 自然 数 集合 ( 由 N 表 示 ) 且 大 于 零 的 x 值 ” 也 就 是 所 有 正 整 数 。 

如 果 你 还 不 熟悉 集合 的 标记 法 ， 就 仔细 看 看 这 个 例子 ， 很 快 便 能 明白 是 怎么 一 回 事 。 坚 线 | 
用 于 分 隅 模板 部 分 和 生成 器 与 约束 条 件 部 分 ,前 者 描述 如 何 构建 单个 元 系 , 后 者 指定 元 素来 源 和 
约束 条 件 。 在 这 个 例子 中 ， 模 板 就 是 xz ， 生 成 霸 则 是 “N 中 的 所 有 x 值 ”， 同 时 还 有 一 个 约束 条 件 ， 
限定 只 有 那些 大 于 零 的 x* 才 能 进入 结果 集 。 总 的 来 说 非常 简单 ， 但 的 确 是 这 类 运算 的 一 种 有 效 的 
表述 形式 。 






































2.9.1 列表 速 构 记 法 


Erlang 是 一 门 编程 语言 ， 而 非 纯 粹 的 数 竺 。 你 可 以 在 语法 中 融入 相同 的 思想 ,但 必须 更 加 具 
体 。 尤其 是 , 元 素 的 顺序 ?和 选用 的 数据 结构 都 显得 更 为 重要 。Erlang 中 用 于 表示 元 素 序列 的 首选 
数据 结构 目 然 是 列表 ,所 以 才 有 所 谓 列 表 速 构 。 语 法 也 要 稍 作 修饰 。 例如, 假设 你 有 一 个 现成 的 
整数 列表 , 正 负 整 数 都 有 , 通过 以 下 方法 你 可 以 便捷 地 从 中 创建 出 一 个 仅 合 正 整数 的 新 列表 ( 它 
们 在 列表 中 的 顺序 仍然 保留 ): 

[xX || xX <- ListOfIintegers, X > 0. 

注意 此 处 必须 使 用 双 竖 线 | | ,因为 单 紧 线 已 经 被 用 在 普通 列表 单元 上 了 。 除 此 以 外 , 我 们 仍 
然 使 用 [ . . .] 来 表示 列表 。 由 于 键盘 上 没有 es ,我 们 用 左 篆 尖 <- 来 表示 生成 带 ; | | 右 侧 除 生 成 右 
以 外 的 部 分 便 是 约束 条 件 ， 如 X > 0。 模 板 部 分 可 以 是 任意 表达 式 ， 并 可 以 使 用 绑 定 于 竖 线 右 侧 
或 列表 速 构 之 外 的 任意 变量 ( 前 着 如 由 生成 带 绑 定 的 变量 X )。 

为 外 ， 如 琳 在 速 构 中 指定 多 个 生成 从 , 便 会 像 写 舱 套 循环 一 桩 产生 元 系 的 各 种 组 合 。 这 种 用 
法 的 用 处 不 多 ,但 偶尔 也 能 用 得 上 。” 


2.9.2 ”上 映射、 过滤 和 模式 匹配 


单个 列表 速 构 可 以 用 于 完成 各 种 映射 和 过 滤 运 算 的 组 合 , 其 中 映射 是 指针 对 元 素 完成 一 些 运 
算 后 再 将 运算 结果 放 入 结 末 列表 。 例 如 , 以 下 的 列表 速 构 能 够 从 源 列 表 中 选 出 所 有 的 正 偶数 (rem 
表示 求 余 运算 ) 并 求 出 它们 的 平方 : 


[ math:pow!{(X,2) | | XxX <- ListoOfintegers, X > 0, X rem 2 == 0 

































































但 列表 速 构 最 强大 的 能 力 还 是 源 目 模式 匹配 。 在 生成 硕 中 , <- 和 箭头 左 侧 不 一 定 是 变量 一 一 可 

J 此 处 注意 数学 中 的 集合 是 不 强调 元 素 的 顺序 的 。 译 者 注 

@ 例如 表达 式 [{X，Y} || X <- [1，2]，Y <- [a，b]] 的 结果 是 [{1,a},{1,b},{2,a},1{2,b}]。 
一 一 译 者 注 
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以 是 任意 模式 ， 跟 匹配 运算 符 (= ) 差不多 。 这 意味 着 生成 送 本 里 就 内 置 了 一 个 约束 条 件 : 只 
与 模式 相 匹 配 的 元 素 才 在 考虑 范 围 内 ; 其 余 元 杂 统 统 忽 略 不 计 。 此 外 , 信 助 模式 你 还 可 以 抽取 出 
元 素 的 不 同 组 成 部 分 并 将 之 用 在 约束 条 件 或 模板 中 。 例 如 ，2.5.4 市 的 area 函 数 曾 经 用 到 一 类 用 
于 表示 几何 图 形 的 元 组 ,现在 假设 你 有 一 个 以 这 类 元 组 为 元 素 的 列表 。 你 可 以 从 中 选 出 那些 面积 
不 小 于 10 的 矩形 ， 并 创建 一 个 与 之 相对 应 的 面积 列表 ， 如 下 : 

[ {area, H*W} || {rectangle, H, W} <- Shapes, H*W >= 10 

你 应 该 试 着 尽 可 能 地 使 用 列表 速 构 。 除 了 效率 因素 外 , 它 也 是 这 类 运算 最 紧凑 和 可 该 的 表达 
形式 。 


2.10 ”比特 位 语法 与 位 串 速 构 


我 们 曾 在 2.2.2 市 介绍 过 二 进 制 串 和 一 般 位 串 , 但 我 们 只 演示 了 如 何 创 建 简单 的 二 进 制 串 (其 
长 度 为 8 的 整数 倍 一 一 即 这 些 二 进 制 串 可 以 视 作 完整 学 市 的 序列 )。 然 而 在 现代 Erlang 中 ， 位 串 的 
长 度 可 以 任意 。 通 过 比特 位 语法 你 可 以 随心 所 欲 地 构造 指定 尺寸 和 布局 的 三 进 制 串 ; 反之 , 它 也 
可 以 用 于 匹配 和 抽取 位 串 中 指定 的 区 段 (例如 从 文件 或 套 接 子 中 读 取 二 进 制 数据 ) 配合 上 速 构 ， 
这 种 语法 会 变 得 极为 强大 。 






































2.10.1 构造 位 串 


位 串 可 以 写作 <<segment1,， ..., SegmentN>>, 其 中 双 小 于 号 和 双 大 于 号 之 间 可 以 包含 
零 个 或 多 个 区 段 指示 符 〈segment specifier )。 位 串 以 比特 位 为 单位 的 整体 长 度 ， 就 是 各 区 段 长 度 
的 总 和 。 

区 段 指示 符 可 以 为 以 下 形式 之 一 : 

Data 

Data:Size 


Data/TypeSpecifiers 
Data:Size/TypeSpecifiers 


Data 必 须 是 整数 、 浮 点 数 或 胃 一 个 位 串 。 你 可 以 将 区 段 长 度 指定 为 单位 长 度 的 某 整 数 倍 ， 
你 还 可 以 指定 区 段 的 类 型 ， 该 类 型 决定 了 如 何 解 谈 pata 以 及 如 何 对 它 进 行 编 解 合 。 人 例如， 这样 
一 个 简单 的 二 进 制 串 <<1, 2 ,3>>， 它 有 3 个 区 段 ， 每 个 区 段 的 数据 都 是 一 个 整数 ， 区 段 既 没有 尺 
二 也 没有 类 型 指示 符 。 这 个 例子 中 , 类 型 默认 为 integer, 而 integer 的 默认 尺寸 为 1。integer 
类 型 的 单位 是 8 比特 位 ， 因 此 区 上 段 被 编码 为 8 位 无 符号 字 方 。 与 此 类 似 ，<<"abc">> 是 
<<$a, Spb,S$c>> 的 缩写 一 一 也 就 是 一 个 8 位 整数 字符 编码 〈Latin-l ) 序列 。 整 数 的 位 数 如 采 超 出 
了 区 段 的 最 大 空间 ， 就 会 被 截断 ， 所 以 <<254,255,256,257>> 就 变 成 了 <<254,255,0,1>>。 

区 段 的 类 型 必须 由 你 指定 ， 不 取决 于 Data 目 身 的 类 型 。 乍 一 看 很 方便 ， 但 这 样 做 实际 上 有 
违 速 错 的 哲学 ,并 可 能 将 你 市 和 是 众 的 境地 一 一 比如 回 文 件 中 写 人 错误 的 数据 什么 的 。 再 举 个 例 
子 ， 你 无 法 像 这 样 串 接 两 个 位 串 : 
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Bl 
B2 
<<B1, B2>> 


因为 默认 情况 下 B1 和 B2 是 被 当 作 整数 的 。 但 如 果 你 指定 BL1 和 B2 是 位 串 ， 就 能 行 得 通 : 
<<B1l/bits, B2/bits>> 
这 样 便 可 以 得 到 你 期 望 的 <<1,2,3,4>>。 
你 可 以 通过 TypeSpecifiers 部 分 (位 于 全 后 面 ) 来 控制 区 有 段 编 解 公 的 细节 。 它 由 一 个 
或 多 个 由 短 杠 ( - ) 分 隔 的 原子 组 成 ， 如 integer-unsigned-big。 原 子 的 出 现 次 序 并 不 重要 。 
当前 你 可 以 使 用 的 指示 符 的 集合 如 下 : 


DD integer、 float、 binary、 bytes、 bitstring、 bits、 utf8、 utf16、 utf32 


<<1 ,2>>, 


人 











signed、unsignedqd 

Dpbig、 little、 native 

作为 特例 ， 还 可 以 加 上 unit: Integer。 这 些 指 示 符 可 以 按 多 种 方式 组 合 ， 但 上 述 列 表 中 
每 组 至 多 只 能 出 现 一 个 。 bits 是 pitstring 的 别名 ， bytes 是 pinary 的 别名 汉 对 于 integer、 
float 和 bitstring 类 型 ， 尺寸 单 位 是 1 比特 位 ，binary 的 单位 则 是 8 比特 位 (一 字 市 )。 

还 有 许多 有 待 讨论 的 细 市 ,篇 幅 所 限 ， 不 再 袭 述 。 当 你 真正 开始 使 用 二 进 制 串 时 , 请 查阅 官 
方 文 档 或 其 他 Erlang 编 程 相关 的 书籍 。 此 处 的 内 容 应 该 足够 让 你 理解 相关 问题 的 概念 了 。 














位 串 中 的 UTF 编码 

Erlang 中 新 进 加 入 了 一 个 功能 , 令 你 能 够 将 位 串 区 段 指 定 为 utf8、utf16 和 utf32 类 型 ， 
可 能 你 已 经 从 前 面 的 类 型 指示 符 列 表 中 注意 到 了 。 这 使 你 能 够 在 位 串 中 使 用 UTF 编码 的 字符 。 
例如 : 

<<"MotOrhead"/utf8>> 

你 无 法 指定 这 类 区 段 的 长 度 ， 它 们 的 长 度 是 由 输入 决定 的 。 在 这 个 例子 中 ， 一共 使 用 了 
10 字 节 来 编码 这 9 个 字符 。 


2.10.2 ”比特 位 语法 中 的 模式 匹配 


正如 你 可 以 用 同样 的 语法 来 构造 和 分 解 元 组 , 你 也 可 以 用 同样 的 比特 位 语法 来 分 解 位 串 中 的 
数据 。 相 较 于 手工 完成 各 种 位 移 和 扼 人 码 运 算 ， 用 比特 位 语法 来 解析 各 种 怪异 的 文件 格式 和 协议 数 
据 显 得 手 到 擒 米 ,也 更 不 容易 出 错 。 作 为 一 个 经 典 示 例 ， 下 面 将 为 你 展示 如 何 利 用 也 数 子 句 中 的 
模式 来 解析 IP 报 文 首 部 的 内 容 : 

ipv4 (<<Version:4, IHL:4, ToS:8, TotalLength:16, 

Identification:16, Flags:3, FragOoffset:13, 
TimeToLive:8, Protocol:8, Checksum:16, 
SourceAddress:32, DestinationAddress:32, 


OptionsAndPadding: ( {IHL-S5)*32) /bits, 
RemainingData/bytes >>) when Version =:= 4 -> 
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只 要 传人 的 报 文 的 尺寸 足够 进行 匹配 ,上 且 version 字 段 为 4, 报 文 便 会 被 解析 为 相应 的 变量 ， 
大 部 分 变量 都 被 解析 为 整数 ， 只 有 optionsaAndPadding (一 个 长 度 取 决 于 先前 解析 出 的 IHL 子 
段 的 位 串 ) 和 RemainingData 段 除外 ， 其 中 后 者 包 合 报 文 首部 之 后 的 所 有 数据 。 从 一 个 二 进 制 
串 中 抽取 为 一 个 二 进 制 串 并 不 涉及 数据 复制 ， 因 此 这 种 运算 的 成 本 很 低 。 


2.10.3 位 串 速 构 


存在 于 很 多 函数 式 编 程 请 言 之 中 的 列表 速 构 的 思想 ， 也 被 扩展 到 了 Erlang 的 比特 位 语法 中 。 
位 串 速 构 酷 似 列表 速 构 ， 只 是 [. . .] 被 换 成 了 <<. . .>>。 以 一 个 小 整数 列表 为 例 , 所 有 整数 都 在 
0 和 7 之 间 ， 你 可 以 按 每 个 数 3 比特 位 将 它们 打包 成 位 串 ， 如 下 : 


<< <<X:3>> | | X <— [1,2,3,4,5,6,7|] >»>> 


shell 会 将 上 式 得 到 的 位 串 打 印 成 <<41,203,23:5>>。 请 注意 末尾 的 23 :5 
8+8+5=21 比 特 位 ， 考 虑 到 输入 列表 包含 7 个 元 素 ， 这 个 结果 是 正确 的 。 

那么 如 何 对 这 样 一 个 位 串 进行 解码 呢 ” 当 然 还 是 用 位 串 速 构 咯 ! 区 别 在 于 这 次 你 需要 将 生成 
怖 中 的 <- 换 成 <=， 表 示 从 位 串 中 提取 内 容 ， 而 <- 只 能 从 列表 中 选取 元 素 : 

<< <<X:8>> || SR wr AA, 2 SS 

得 到 的 二 进 制 串 是 <<1,2,3,4,5,6,7>>， 由 此 可 见 ， 此 前 你 确实 成 功 地 将 3 比特 位 整数 格 
式 转换 成 了 8 比特 位 整数 格式 。 但 奎 你 希望 结果 是 列表 而 非 位 串 该 怎么 办 呢 ?” 把 位 串 生成 絮 用 到 
列表 速 构 里 就 可 以 了 ! 

[| eX 2 

产生 的 对 应 的 列表 为 [1,2,3,4,5,6,7]。 我们 建议 你 在 shell 中 多 多 把 玩 一 下 比特 位 语法 。 
借助 比特 位 语法 和 一 点 点 创造 力 你 便 可 以 完成 很 多 有 趣 的 事情 。 











位 串 的 总 长 度 为 























2.11 记录 语法 


为 了 不 让 之 前 的 草 广 被 各 种 怪异 语法 所 充斥 ， 我 们 直到 现在 才 来 介绍 Erlang 的 为 一 个 重要 组 
成 部 分 : 记录 语法 。 

元 组 是 大 部 分 Erlang 结 构 化 数据 的 基石 ， 然 而 从 软件 工程 角度 上 看 ， 它 们 还 不 够 灵活 。 想 象 
一 下 ， 在 你 的 设计 中 每 个 客户 的 信息 〈 打 个 比方 ) 部 由 一 个 含有 五 个 元 系 的 元 组 来 表示 ， 你 开 
发 的 整个 程序 ( 可 能 包含 多 个 模块 ) 痢 围 绕 着 这 个 设计 展开 。 随 着 业务 的 演化 ， 你 很 可 能 会 发 
现 需 要 增加 一 个 字段 ， 于 是 你 不 得 不 跑 志 所 有 代码 并 修改 所 有 涉及 这 些 元 组 的 地 方 ， 既 包括 创 
建 元 组 的 地 方 ， 也 包括 各 个 针对 它们 做 匹配 的 模式 。 更 不 用 说 在 这 个 过 程 中 是 多 么 容易 犯错 : 
要 是 一 不 小 心 在 什么 地 方 误 把 五 元 组 写成 了 四 元 组 ， 或 是 在 到 处 浴 加 新 的 字段 时 俩 俩 把 某 个 实 
例 给 筷 了 怎么 办 ? 为 了 解决 这 个 问题 〈 但 不 牺牲 元 组 的 速度 和 较 低 的 内 存 消耗 ) 我 们 引入 了 记 
录 语 法 。 
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2.11.1 记录 声明 


记录 语法 让 你 可 以 使 用 记录 , 它们 本 质 上 就 是 标记 元 组 , 但 避免 了 使 用 元 组 时 增 减 字段 所 带 
来 的 麻烦 以 及 必须 记 住 各 个 字段 在 元 组 中 的 顺序 的 问题 。 使 用 记录 时 的 第 一 要 务 就 是 写 下 记录 声 
明 ， 就 像 这 样 : 

-record(customer, {name="<anonymous>", address, phone}}). 

该 声明 告诉 编译 需 你 将 要 使 用 一 个 四 元 组 ( 3 个 字段 加 上 标记 )， 其 中 第 一 个 元 素 总 是 原子 
customer。 其 他 字段 的 顺序 与 记录 声明 中 一 致 ， 因 此 name 总 是 第 二 个 字段 。 

















3 











2.11.2 创建 记录 
你 可 以 使 用 以 下 几 种 语法 来 创建 新 的 记录 元 组 : 


#customert{} 


#customer{phone="55512345"}) 


#customer{name="Sandy Claws", address="Christmas Town'", phone="55554321"} 

记录 名 之 前 必须 加 上 #， 这 样 编 详 肖 才 会 将 之 与 记录 声明 相 匹 配 。 在 {. ..} 之 内 ， 你 可 以 选 
择 任 音字 上 段 按 任意 顺序 进行 赋值 (一 个 都 不 选 也 行 )。( 编 详 冀 会 按 声 明 中 的 顺序 为 它们 排序 。) 
未 赋值 的 那些 字段 将 被 置 为 默认 值 ， 即 原子 undaefined， 除 非 你 在 声明 中 另行 指定 了 默认 值 。 


2.11.3 ”记录 的 字段 以 及 模式 匹配 
假定 你 已 经 将 变量 R 绑 定 到 了 上 述 3 个 例子 中 的 第 二 个 。 现 在 你 可 以 用 点 分 记 法 来 访问 各 个 

















2 EL 

字段 : 
R#customer.name 一 "<ANONYMOUS>" 
R#customer.address — undefined 
R#customer .phone > "S55S5512345" 





和 之 前 一 样 , 你 需要 明确 指定 记录 名 称 来 告知 编译 器 :“ 将 了 R 中 的 元 组 当 作 一 条 customer 记 录 
来 处 理 。 不 过 最 篆 用 的 提取 记录 字段 的 手段 还 是 模式 匹配 。 以 下 图 数 接受 一 个 customer 记 录 作 为 
输入 参数 并 确 保 电话 号 但 不 为 undefined: 


DrInt contact (#customer{name-=Name, address-=Addr, phone=Phone}) 
when Phone =/-= undefined -> 








io:format ("Contact: ~s at ~s.~n'", [Name, Phone]}. 
这 跟 拿 元 组 做 匹配 很 类 似 ， 只 不 过 不 再 需要 关心 字段 的 数量 和 顺序 了 。 如 采 你 在 记录 声明 中 
增加 字段 或 调整 字段 的 顺序 ， 只 需 重 新 编译 代码 ， 便 可 像 往 稼 一 样 正 浓 工 作 。 














2.11.4 更 新 记录 字段 


如 前 所 述 ， 在 Erlang 中 是 无 法 部 分 更 新 现 有 的 数据 结构 的 ， 至 少 不 能 就 地 更 新 。 你 只 能 从 原 
数据 中 创建 一 个 新 的 、 市 些许 修改 的 副本 。 例 如 ， 要 想 更 新 一 个 四 元 组 ， 你 就 必须 创建 一 个 新 的 
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四 元 组 并 将 无 须 修 改 的 元 素 原封 不 动 地 复制 过 来 。 这 上 听 起 来 很 低 效 , 但 实际 上 每 个 元 系 只 震 耗 充 
一 个 字 长 的 复制 成 本 一 一 浅 复制 。 元 组 的 创建 速度 很 快 : Erlang 优 化 了 大 量 小 型 元 组 和 列表 单元 
的 高 速 创建 (及 回收 ) 一 一 它们 既 可 以 作为 便签 数据 ， 也 可 作为 永久 性 的 数据 结构 。 

字段 更 新 的 语法 与 创建 新 记录 的 语法 类 似 , 只 不 过 你 需要 说 明 原 记录 的 来 源 。 仍然 假定 前 一 
方 的 第 二 个 customer 记 录 被 存放 在 变量 R 中 。 下 面 将 创建 R 的 一 个 副本 并 修改 其 中 的 name 和 


adqdqress 字 段 : 








Ri¥customer{name="Jack Skellington'", address="Hallowe'en"™} 

一 定 要 记 住 此 处 R 本 里 并 没有 被 修改 , 你 也 不 能 重新 将 R 赋 值 为 新 的 值 ; 要 想 把 更 新 结 采 绑 定 
到 变量 ， 就 必须 再 用 一 个 新 的 名 字 ， 比 如 R1 什 么 的 。 另 一 方面 ， 如 果 创 建 R1 之 后 程序 中 再 也 没 
有 别处 会 用 到 R， 那 么 R 会 被 目 动 回收 。( 隐 明 的 编 详 肯 有 时 能 够 发 现 R 即 将 被 回收 ， 于 是 会 百 接 
用 BR 来 创建 新 的 R1。 ) 


2.11.5 ”记录 声明 应 该 放 在 哪儿 


对 于 仅 用 于 单个 模块 中 的 记录 , 一 般 直 接 将 记录 声明 写 在 模块 的 顶部 ， 和 导出 声明 及 其 他 类 
似 声 明 一 起 放 在 模块 首部 。 然 而 如 果 要 在 多 个 模块 中 使 用 同一 个 记录 声明 , 做 法 便 有 所 不 同 。 你 
不 会 希望 在 多 个 源码 文件 中 重复 定义 同一 个 记录 ( 这 样 一 来 将 难以 同步 修改 声明 )， 因 此 你 应 该 
将 这 些 需要 共享 的 定义 放 到 独立 的 头 文件 中 , 供 所 有 需要 这 些 定 义 的 模块 读 取 。 这 一 切 都 由 预 处 
理 需 负责 处 理 ， 而 那 正 是 我 们 的 下 一 个 主题 。 


2.12” 预 处 理 与 文件 包含 


Erlang 的 预 处 理 器 与 C/C++ 的 类 似 ， 也 就 是 说 这 是 个 语 元 "级 ( token-level ) 预 处 理 器 。 语 元 
就 是 从 源码 文件 中 切 分 出 来 的 独立 词汇 和 符号 , 送 交 预 处 理 带 处 理 的 便 是 语 元 序列 ,而 非 文本 中 
的 字符 。 这 种 预 处 理 硕 更 易于 理解 ， 但 能 力也 会 受到 一 定 的 限制 。 

预 处 理 是 编译 过 程 的 一 部 分 ， 预 处 理 套 负责 3 个 重要 任务 : 宏 展 开 、 文 件 包 含 和 条 件 编译 。 
我 们 来 依次 看 看 这 3 个 任务 。 






































2.12.1 宏 的 定义 和 使 用 


宏 由 define 指 邻 定义 既 可 以 带 参 数 也 可 以 不 带 人 参数 , 举例 如 下 : 
-definet{pPI, 3.14) ， 
-define (pair (X,Y), {X, Y}}. 


中 语 元 ( token )， 指 语法 分 析 中 不 可 分 割 的 早 小 语法 单元 。 在 语法 分 析 之 前 ，Erlang 编 译 右 会 借助 词法 分 析 先 将 源 
码 切 分 成 语 元 。 该 译 法 了 取 自 《实用 Common Lisp 编 程 》 译 者 田 春 的 建议 。 目 前 译 者 查阅 到 的 采用 相同 译 法 的 文 
献 仅 有 台湾 静 宜 大 学 咨询 管理 系 蔡 奇伟 的 《PuTeX4.0 Big5 版 使 用 手册 ( Rev 1.0 )》( www.cs.pu.edu.tw/~ 
tsay/putex/doc/guide40.pdf )。 一 一 译 者 注 











图 灵 社 区 会 员 for(;;)(13433955876@163.com) 专 享 尊重 版 权 





02 第 2 章 Erlang 语 蕊 言 精 要 





在 命名 上 ，Erlang 变 量 和 原子 的 命名 规则 都 适用 于 宏 ， 但 习惯 上 常量 名 为 大 写 ， 其 余 大 部 分 
宏 为 小 写 。 在 代码 中 使 用 宏 〈 按 其 定义 进行 展开 ) 时 ， 必 须 加 一 个 问号 作为 前 级 : 


circumference({Radius})} -> Radius * 2 * ?PI. 
pair of pairs{(A, B, C, D) -> ?pair{ ?pair{(A, B}), ?pair{C, D) ). 
在 正式 编译 之 前 ， 这 段 代 码 会 被 展开 如 下 : 


circumference (Radius}) -> Radius * 2 * 3.14. 





Dair of pairsiA, B, CC, DB) => { (A, B}, {tC, DY 于 

宏 不 是 函数 的 蔡 代 品 ， 当 你 所 需 的 抽象 无 法 用 普通 也 数 来 实现 时 ， 宏 给 出 了 一 条 生路 : 比如 
必须 确保 在 编译 期 展开 某 些 代码 的 时 候 ， 或 者 是 在 语法 不 允许 执行 孔 数 调用 的 时 候 。 

1. 取消 宏 定 义 

undef 指 令 可 用 于 移 除 宏 定 义 ( 前 提 是 该 宏 定义 存在 )。 例如， 经 由 下 列 几 行 代码 之 后 


-define!{({foo, false}). 

















-undef (foo}). 
-define({foo, true)}). 


foo 安 最 终 被 定义 为 true。 

2. 常用 的 预定 义 宏 

方便 起 见 ， 预 处 理 需 预先 定义 了 一 些 安 ， 其 中 最 有 用 的 大 概 就 是 MoDULE 安 了 。 它 展开 后 是 
= 个 原子 ， ee 你 还 可 以 用 FILE 和 LINE 宏 获悉 当前 正身 处 哪 
个 源 文件 的 哪 一 行 ， 如 下 所 示 : 


current pos{) -> [{module, ?MODULE}, {filje, ?FILE}, {line, ?LINE}]. 


与 记录 声明 ( 参见 2.11 市 ) 类 似 ， 要 想 在 多 个 源码 文件 中 共享 同一 个 宏 ， 就 必须 将 宏 定 义 放 
入 头 文件 O 这 正好 将 我 们 大 人 下 一 小 市 O 


2.12.2 文件 包含 
通过 使 用 包含 指令 ，Erlang 源 码 文 件 可 以 包含 男 一 个 文件 ， 形 式 如 下 : 


-include ("filename.hrl"). 
预 处 理 需 会 广 取 被 包含 文件 的 内 容 并 将 之 插入 到 包含 指令 所 处 的 位 置 。 这 类 文件 中 通常 只 有 
声明 , 没有 吨 数 ; 文件 包含 一 般 都 出 现在 模块 源 文件 的 头 部 ， 因 此 这 些 文件 也 被 称 为 头 文件 。 按 
惯例 ，Erlang 头 文件 以 .hr 为 扩展 名 。 
在 查找 由 -ijnclude ("some_file.hrl") .这 类 指令 指定 的 文件 时 ，Erlang 编 译 冀 会 同时 在 
当前 目录 中 以 及 列 于 包含 路 径 内 的 目录 中 查找 名 为 some _file.hrl 的 文件 。 利 用 erlc 的 -I 标志 ， 或 
shell 函 数 c (...) 的 {i,Directory} 选 项 可 以 癌 包 含 路 径 中 添加 新 的 目录 ， 如 下 : 


1> c{'"src/my moGule"”™, [ {i, "../include/"} |]}). 


























include 1Lib 指 令 


如 打 你 的 代码 依赖 于 别 的 Erlang 应 用 或 库 的 头 文件 ， 你 就 必须 知 利 该 应 用 的 安 竣 位置， 以 便 
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将 它 的 头 文 件 目录 纳入 包 仿 路径。 此 外 , 安 痛 路 径 中 还 可 能 含有 版 本 号 ， 导 致 应 用 升级 后 包含 路 
径 也 要 跟 痢 更 新 。 为 了 尽量 避免 这 些 及 烦 ，Erlang 提 供 了 一 个 特殊 的 包含 指令 : include_1ib。 
用 法 举例 如 下 : 

-include lib{"'kernel/include/file.hrl"). 

该 指令 会 相对 于 Erlang 系 统 现 有 应 用 ( 尤其 是 所 有 随 Erlang 一 并 发 布 的 标准 库 ) 的 安装 位 置 
来 查找 文件 。 比 如 kermel 应 用 可 能 被 安装 在 C:\Program Files\erl5.6.5\ib\kernel-2.12.5。 于 是 
include_1lip 指 令 会 将 文件 名 起 始 处 的 kernel/ 匹 配 至 这 个 路 径 ( 除去 版 本 号 ) 并 在 此 目录 下 寻找 
含有 file.hrl 的 子 目录 include。 即 便 Erlang 升 级 ， 你 的 程序 也 不 用 做 任何 修改 。 




















2.12.3 条件 编译 


条 件 编译 就 是 让 编译 占 按 特定 条 件 忽 略 程序 的 某 些 部 分 。 这 种 手法 常用 于 生成 程序 的 多 种 版 
本 , 比如 专用 于 调试 的 版 本 。 以 下 预 处 理 指 令 可 以 控制 编 详 带 在 特定 的 时 机 忽略 特定 位 置 的 代码 : 


-ifdef (MacroName)}). 





-ifndef (MacroName). 

-else， 

-endif. 

恰 如 其 名 ，ifqdef 和 ifndef 用 于 测试 某 个 宏 是 否 被 定义 过 。 每 个 1fqef 或 ifndef， 痢 必 有 一 
个 配对 的 endif 来 标识 条 件 编译 区 ( conditional section ) 的 结束 。 此 外 ,还 可 以 用 else 将 条 件 编译 
区 切 为 两 段 。 例如, 在 以 下 代码 中 只 有 定义 了 DEBUG 宏 (定义 成 任何 值 丝 可 ) 才 能 导出 函数 f00/1: 


-ifdef (DEBUG). 
-export{([foo/1]}). 
-endif. 


你 可 以 通过 Shell 国 数 c 的 {dqa,MacroName,Value} 选 项 或 erlc 命 令 的 -Dname=value 和 选项， 在 命 
令 行 下 或 在 自己 的 构建 系统 中 对 此 进行 控制 。DEBUc 安 的 值 在 此 无 关 紧 要 ， 一 般 取 值 为 true 即 可 。 

Erlang 中 以 句号 结尾 的 声明 统称 为 form，Erlang 的 解析 需 便 是 以 form 为 单位 来 工作 的 ， 条 件 
编译 不 能 用 在 函数 定义 内 部 , 因为 ifaqef 后 面 的 句号 会 被 解析 硕 误 判 为 函数 定义 的 结束 符 。 不 过 ， 
你 可 以 定义 一 个 受 条 件 编 详 控制 的 安 ， 然 后 在 函数 里 使 用 它 ， 像 这 样 : 

-ifdef (DEBUG). 

-define{show{(X)}, io:format{({"The value of X js: ~w.~n'", [X]}}. 

-elSe. 


-define{show{X), ok). 
-end1if. 


foo{A) 一 > 
?Show (A}), 


如 琳 在 编译 时 定义 了 DEBUG 容 ， 峭 数 foo 会 首先 将 A 的 值 打印 到 终端 ,然后 再 接着 执 行 后 续 的 
人 代码。 否则， 函数 的 第 一 个 表达 式 将 展开 为 原子 肖 量 ok, 该 钊 量 坚 无 用 处 ， 编 详 胡 会 通过 优化 将 
之 抹 除 。 
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2.13 ”进程 


在 第 1 章 ， 我 们 曾 介绍 过 进程 、 消 息 ， 以 及 进程 链接 和 信号 的 概念 。 我 们 还 在 2.2.7 节 描述 过 
进程 标识 符 (pid )。 这 一 节 ， 我 们 将 讨论 运用 Erlang 进 程 时 应 当 了 解 的 最 为 午 要 的 内 容 。 





2.13.1 操纵 进程 


在 1.1.4 节 ， 我 们 演示 了 如 何 铂 生 进 程 ， 用 ! 运 算 符 在 进程 之 间 发 送 消 息 ， 以 及 用 receive 从 
言 箱 中 提取 消息 。 那 时 我 们 尚未 深入 介绍 模块 、 阴 数 名 和 函数 的 元 数 , 但 现在 你 对 它们 已 经 非常 

1. 派生 和 链接 

进程 派生 师 数 有 两 个 : 第 一 个 艺 数 仅 有 一 个 参数 ， 就 是 用 作 新 进程 入 口 的 ( 空 元 ) ftn 陋 数 ; 
男 一 个 则 需要 模块 名 、 哺 数 名 和 参数 列表 3 个 参数 : 

PE 

Pidqd 

















spawn (fun() -> do something() end) 


spawn (Module, Function, ListOfArgs,) 

第 二 种 方法 要 求 给 定 的 函数 必须 事先 从 模块 中 导出 , 且 初 始 数据 只 能 由 参数 列表 传人 。 同 时 ， 
第 二 种 方法 总 会 采用 模块 的 最 新 版 本 , 在 调用 远程 机 各 上 的 消 数 时 一 般 推 荐 这 种 方法 ,因为 远程 
机 融 上 的 模块 版 本 与 本 地 版 本 有 可 能 不 一 致 。 利 用 这 种 方法 小 生 进程 的 示例 如 下 : 

Pid = spawn (Node, Module, Function, ListOfArgs) 

此 外 ， 还 有 一 个 名 为 spawn_opt (...) 的 版 本 ,该 版 本 可 和 额外 接受 一 个 选项 列表 : 

Pid = spawn opt (fun(}) -> do something(})} end, [monitor]} 
spawn_opt (...) 可 识别 的 选项 之 一 就 是 link。 有 一 个 专门 针对 该 选项 的 孔 数 用 于 人 简化 调用 : 

Pid = spawn link(...;) 

先 派 生 进程 再 用 1ink (Pig) 创建 链接 会 引入 竞 态 条 件 ”"，spawn_link(...) 则 可 以 确保 进 
程 创 建 与 进程 链接 创建 的 原子 性 ， 从 而 避免 部 态 条 件 。 

所 有 这 些 派生 函数 都 会 返回 新 进程 的 进程 标识 符 ， 通 过 该 标识 符 父 进程 可 以 与 新 进程 通信 。 
然而 新 进程 对 父 进程 却 一 无 所 知 ， 只 能 通过 其 他 方式 获悉 相关 信息 。 

通过 内 置 函数 self () 进程 可 以 获取 自身 的 pid。 例 如 ， 以 下 代码 派生 出 的 子 进程 知道 自己 的 














父 进程 是 谁 : 
Parent = Selftf) ， 
Pid = spawn (fun{() -> myproc:init(Parent} end) 


这 段 代 码 假设 myproc:init/1 是 你 所 要 局 动 的 子 进程 的 入 口 ， 并 将 父 进 程 的 儿 作为 唯一 参数 。 特 
别 需 要 注意 的 是 self () 必须 在 fun. . .end 之 外 调用 , 否则 执行 调用 的 将 是 新 的 于 进程 ( 它 并 不 知 
过 目 己 的 父 进 程 是 谁 ) 这 就 是 为 什么 要 先 获取 父 进程 的 pid 再 通过 变量 将 之 传 给 子 进 程 。( 回想 一 











OD 先 派生 进程 再 创建 链接 的 问题 在 于 ， 如 果 新 进程 在 链接 创建 前 终止 ， 其 他 进程 无 法 收 到 进程 终止 的 通知 。 
一 译 者 注 
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下 我 们 在 2.7.2 闻 讲 过 的 闭 包 ， 这 里 的 派生 函数 拿 到 的 就 是 一 个 即将 运行 在 新 进程 中 的 闭 包 。 ) 

2. 进程 监视 

链接 有 一 个 符 代 品 ， 称 作 监 视 。 这 是 一 种 单 问 链接 ， 可 以 让 一 个 进程 在 不 影 响 目标 进程 的 情 
况 下 对 目标 进程 施行 监视 。 

Ref = monitor (process, Pid,) 
由 Pig 标 识 的 进程 一 旦 退出 ， 实 施 监 视 的 进程 将 会 收 到 一 条 含有 唯一 引用 Ref 的 消息 。 

3. 靠 抛 异常 来 终结 进程 

exit 类 异常 用 于 终止 运行 中 的 进程 。 这 类 异常 可 通过 BIF exit7/1 抛 出 : 

exit (Reason 
除非 被 进程 捕获 ， 否 则 该 调用 将 令 进程 终止 ， 并 将 Reason 作 为 退出 信号 的 一 部 分 发 送 给 所 有 与 
该 进程 链接 的 进程 。 

4. 直接 向 进程 发 送 退 出 信号 

进程 除了 在 意外 退出 时 会 自动 发 送信 号 以 外 , 还 可 以 直接 回 其 他 进程 发 送 退 出 信和 号。 收发 双 
方 事 先 无 须 链接 : 

exit {Pid, Reason, 

注意 这 里 用 的 是 exit/2， 而 非 exit/1 一 一 它们 是 完全 不 同 的 子 数 ( 却 不 王者 名 为 exit )。 
该 信号 终止 的 不 是 发 送 方 ， 而 是 接收 方 。 如 果 Reason 是 原子 ki11， 接 收 方 将 无 法 捕获 该 信和 号， 
从 而 被 强制 终止 。 

5. 设置 trap_exit 标 志 

默认 情况 下 ,一旦 接收 到 来 自 相 互 链接 的 其 他 进程 的 退出 信和 号， 进程 束 会 退出 。 为 了 避免 这 
种 行为 并 捕捉 退出 信号 ， 进 程 可 以 设置 trap_exit 标 志 : 

process flagl(trap exit, true; 

这 样 一 来 ， 除 了 无 法 捕获 的 信号 ( ki11 ) 以 外 ， 外 来 的 退出 信号 都 会 被 转换 成 无 害 的 消息 。 
2.13.2 ”消息 接收 与 选择 性 接收 

接收 消息 的 进程 可 以 用 *eceive 表 达 式 从 信箱 队列 中 提取 消息 。 尽 管 接 收 到 的 消息 严格 按照 
抵达 顺序 排列 ,接收 方 仍 然 可 以 自行 决定 要 提取 哪 条 消息 。 选 择 性 地 忽略 当前 和 暂 不 相关 的 消息 ( 比 
如 提前 到 达 的 消息 ) 的 能 力 是 Erlang 进 程 通信 的 一 个 关键 特性 。receive 的 一 般 形式 如 下 : 


receive 
Patternl when Guardl -> Bodyl: 






































PatternN when GuardN -> BodyN 
after Time 一 > 





TimeoutBody 
会 卫 人 本 


after.. -| 权 梧 过， 如 果 省 上 略 ， receive 永 不 超时 。 否则 ， Time 必 须 是 表示 齐 秒 数 的 整数 或 原 
子 infinity。 如 果 Time 为 0， receive 永 不 阻塞 。 无 论 哪 种 情况 ， 只 要 信箱 中 没有 匹配 的 消息 ， 
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receive 便 会 一 下 等 到 匹配 的 消息 到 达 或 发 生 超 时 为 止 , 无 论 先后 。 等待 期 间 进 程 将 被 挂 起 ,只 
有 新 消息 到 来 时 才 会 被 唤醒 。 

每 次 执行 时 ，receive 会 完 检查 最 老 的 消 有 筷 ( 位 于 队列 头 部 ) 像 在 case 表 达 式 中 那样 答 试 
将 消息 与 子 名 匹配 ， 如 果 找 不 到 匹配 的 子 句 ， 就 继续 检查 下 一 条 消息 。 如 果 某 个 子 句 的 模式 与 当 
前 消息 匹配 成 功 ， 且 保护 式 成 立 〈《 如 打 有 的 话 )， 该 消息 便 会 被 移出 信箱 ， 同 时 与 子 句 对 应 的 正 
文 将 被 执行 。 如 采 一 下 等 到 超时 也 没有 找到 合适 的 消息 ,超时 部 分 的 正文 便 会 被 执行 ,信箱 则 维 
持原 样 。 











2.13.3 注册 进程 


每 个 Erlang 系 统 都 有 一 个 本 地 进程 注册 表 一 一 这 是 一 个 用 于 注册 进程 的 简单 命名 服务 。 一 个 
名 称 一 次 只 能 用 于 一 个 进程 ,换言之 该 机 制 仅 适 用 于 单 例 进程 : 一 般 都 是 些 系统 服务 ， 这 些 服务 
在 每 个 运行 时 系统 中 同一 时 刻 最 多 只 能 有 一 个 实例 。 启 动 Erlang shell 并 调用 内 置 函 数 
registered() ， 你 将 看 到 如 下 类 似 的 输出 : 


1> registeredqd{(). 








[rex, kernel] sup,global name server,standard error sup, 
inet_db,file server 2,1init,code server,error_ logger., 
usSer_drv,application controller,standard error., 
kernel_safe sup,global_group,erl _ prim loader,userl] 

2> 


夏 不 少 啊 。Erlang 系 统 本 里 很 像 是 跑 着 一 组 重要 系统 服务 的 操作 系统 ( 其 中 一 个 服务 甚至 叫 
ne 用 内 置 函 数 whereis 可 以 查找 当前 与 指定 注册 名 对 应 的 pid: 
2> whereis (user)}). 


<0.24.0> 
3> 


你 甚至 可 以 直接 用 注册 名 回 进 程 发 送 消息 : 

1> init 1! {stop, stop}. 

(实验 了 没 ” 这 个 拉 巧 比较 上 星 深 ， 它 依赖 于 系统 进程 间 的 消 恩 格式 。 这 些 格式 没准 儿 哪 天 还 
人 人 

你 可 以 用 register 函 数 注册 目 己 局 动 的 进程 : 

1> Pid = spawn (timer, sleep, [60000]}). 


<O0.34.0> 
2> register {fred, Pid). 

















true 

3> whereis (fred)}). 
<0.34.0> 

4> whereis (fred). 
undefined 

b> 


( 注意， 在 这 个 示例 中 ， 你 启动 的 进程 将 在 60 秒 后 终止 ， 届 时， 之 前 注册 的 名 称 将 目 动 回归 
到 未 定义 状态 。) 


GD 大 部 分 类 UNIX 操 作 系 统 启动 后 的 初始 进程 都 叫 init。 一 一 译 者 注 
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此 外 ， 要 想 跟 位 于 万 一 个 ErlangT 点 上 的 注册 进程 通信 ， 可 以 这 样 做 : 

6> {Some node name, some registered name} ! Message. 

以 下 这 种 情况 可 以 体现 出 注册 进程 的 主要 优点 : 假设 某 注 册 进 程 衣 尝 ， 对 应 的 服务 被 重 局 ， 
新 服务 进程 的 进程 标识 符 将 发 生变 化 。 此 时 无 须 将 rex 服 务 ( 以 此 为 例 ) 的 新 pid 未 个 通知 给 系统 
中 的 所 有 进程 ,只 要 更 新 进程 注册 表 即 可 。( 但 在 服务 完成 重 局 和 注册 之 前 , 会 存在 一 段 真空 期 ， 
期 间 该 名 称 不 指向 任何 进程 。) 





2.13.4 ”消息 投递 与 信号 


Erlang 进 程 互 相 用 ! 运 算 符 发 送 的 消息 只 是 Erlang 通 用 信号 系统 的 一 种 特 丈 形式 。 另 一 大 类 信 
号 就 是 濒 死 进程 向 与 之 链接 的 相 邻 进程 发 送 的 退出 信号 ; 还 有 一 小 部 分 信号 对 程序 员 不 可 见 , 诸 
如 尝试 链接 两 个 进程 时 发 送 的 链接 请 求 。( 试想 两 个 分 处 不 同 机 融 上 的 进程 ， 你 就 会 明白 为 什么 
这 些 请 求 必须 以 信号 的 形式 存在 。 由 于 链接 是 双 同 的 ， 双 方 都 必须 知晓 链接 的 存在 。 ) 
投递 信号 时 ， 以 下 的 基本 投递 保障 对 所 有 信号 都 成 立 。 
口 如 果 进 程 P1 回 同一 个 目标 进程 P2 先 后 发 送 两 个 信号 S1 和 $2 (不 论 进程 在 发 送 S1 和 发 送 S2 
之 间 做 了 些 什 么 ， 也 不 论 两 个 信号 的 间隔 时 间 有 多 和 久 )， 这 两 个 信号 将 按 发 送 顺 序 到 达 P2 
(如 果 都 能 到 达 的 话 )。 也 就 是 说 ， 抛 开 其 他 不 谈 ， 退 出 信号 绝 不 会 掩盖 进程 临 死 前 的 最 
后 一 条 消息 ， 消 息 也 绝 不 会 掩盖 链接 请 求 。 这 是 Erlang 进 程 间 通信 的 基础 。 
口 尽 力 投递 所 有 信和 号。 同一 Erlang 运 行 时 系统 内 ， 进 程 之 间 不 存在 消息 丢失 的 和 危险。 但是， 
在 两 个 依靠 网 络 互联 的 Erlang 系 统 之 间 ,， 一 旦 网 络 连接 断 开 ,消息 就 有 可 能 丢失 ( 部 分 依 
赖 于 传输 协议 )。 连 接 恢 复 后 ， 有 可 能 出 现 上 例 中 的 S2 最 终 抵达 但 S1 却 丢失 的 情况 。 
大 部 分 情况 下 ， 你 不 用 太 关 注 消息 的 时 序 和 投递 成 功率 一 一 系统 的 行为 与 你 的 预期 基本 一 致 。 


















































2.13.5 ”进程 字 暴 


作为 自身 状态 的 一 部 分 , 每 个 进程 都 有 一 个 私有 的 进程 字典 , 这 是 一 个 可 以 用 任何 值 作为 键 
的 简单 哈 希 表 ， 用 于 存储 Erlang 项 式 。 通 过 内 置 了 两 数 put (Kev，Value) 和 get (Key，Value) 可 
以 从 中 存 取 项 式 。 我 们 不 打算 详细 介绍 进程 学 典 , 在 此 我 们 只 想 告诉 你 ,无 论 进程 字典 看 起 来 多 
么 诱 人 都 不 要 去 碰 它 。 
口 最 简单 的 原因 在 于 它 让 程序 的 行为 难以 理解 。 程 序 的 行为 无 法 再 直接 通过 代码 看 出 ， 相 
反 ， 你 不 得 不 先 找 出 执行 代码 的 进程 并 搞 明 白 该 进程 当前 的 状态 才能 得 出 准确 的 结论 。 
口 更 重要 的 是 它 令 进程 间 迁 移 任务 的 难度 增加 甚至 趋 于 不 可 能 。 引 入 进程 字典 前 你 可 以 在 
一 个 进程 完成 一 部 分 工作 后 ， 将 剩 下 的 任务 交 巾 另 一 个 进程 完成 。 现 在 除非 第 一 个 进程 
将 字典 数据 打包 发 送 给 第 二 个 进程 ， 和 否则 新 进程 拿 不 到 正确 的 字典 数据 。 
口 在 开发 库 的 时 候 , 如 果 将 某 些 来 自 不 同 客户 端 调 用 的 信息 存 人 进程 字典 ( 很 像 是 Web 服 务 
器 使 用 cookie )， 客 户 端 就 被 迫 只 能 使 用 单个 进程 来 处 理会 话 。 如 果 客 户 端 用 别 的 进程 来 
调用 你 的 API， 将 缺少 必要 的 上 下 文 。 
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在 某 些 情况 下 进程 字典 也 有 合理 的 用 法 , 但 一 般 而 言 ， 总 会 有 更 好 的 数据 存储 方案 (需要 的 
话 甚 至 可 以 在 不 同 进程 间 共 至 信息 )。 这 种 方案 的 名 字 比 较 怪 ， 叫 作 ETS 表 。 








2.14 ETS 表 


ETS 代 表 Erlang 项 式 存储 ( Erlang Term Storage )。 所 谓 ETS 表 就 是 一 张 用 于 存储 Erlang 项 式 ( 即 
任意 Erlang 数 据 ) 且 可 以 在 进程 间 共 至 的 表 。 不 过 这 不 是 违背 7 了 基本 的 引用 透明 性 和 避免 共 诗 的 
原则 了 吗 ? 难 不 成 我 们 走 了 后 门 偷偷 措 摸 地 干 起 破坏 性 更 新 的 勾当 来 了 ? 四 个 字 : 进程 语义 。 


2.14.1 为 何 ETS 表 被 设计 成 这 样 


Erlang ETS 表 背后 的 基本 设计 思想 就 是 ， 尽 量 让 它们 的 接口 和 行为 与 独立 的 进程 一 般 无 二 。 
即便 用 进程 重新 实现 ETS 表 ， 也 无 须 对 接口 做 任何 修改 。 但 实际 上 ，ETS 是 作为 Erlang 运 行 时 系 
统 的 一 部 分 用 C 实 现 的 , 既 轻 量 又 快速 ,接口 函数 也 都 是 BIF。ETS 表 的 性 能 之 所 以 受到 如 此 的 关 
注 ， 原 因 在 于 ETS 是 Erlang 中 很 多 东西 的 基础 。 

你 仍然 应 该 尽 可 能 地 避免 数据 共享 ， 尤 其 是 要 避免 那 种 出 其 不 意 地 在 别人 硼 后 修改 数据 的 
行为 。 然 而 ， 如 果 一 种 存储 机 制 是 通过 常规 进程 语义 和 消息 传递 来 实现 的 ， 就 不 会 有 什么 根本 
问题 ， 可 以 放心 大 胆 地 使 用 。 更 不 用 说 这 原本 就 是 你 迟早 要 用 到 的 东西 : 用 于 数据 存储 的 高 效 
哈 希 表 。 

ETS 表 很 像 是 简化 了 的 数据 库 服务 器 : 与 外 界 隔离 ， 并 持 有 一 些 供 多 方 使 用 的 数据 。 相 较 于 
Java、C 或 其 他 类 似 语 言 中 的 数组 ， 其 区 别 在 于 使 用 ETS 的 客户 问 明 确 知 晓 它 们 是 在 跟 一 个 有 日 
己 的 生存 期 的 实体 打交道 , 并 且 从 同一 张 表 中 读 到 的 内 容 也 可 能 随时 间 的 不 同 而 不 同 。 但 与 此 同 
时 , 它们 也 可 以 确信 自己 之 前 该 取 到 的 内 容 绝 不 会 被 偷偷 措 措 地 修改 。 在 表 中 查找 一 个 条 目 ， 你 
就 会 得 到 该 条 目下 当前 存储 的 元 组 。 即便 有 人 旋即 将 表 中 同一 位 置 更 新 成 了 新 的 元 组 , 你 读 到 的 
数据 也 不 会 受到 影响 。 相 比较 而 言 ， 如 果 是 在 Java 数 组 中 查找 对 象 ， 则 随后 出 现 的 其 他 线程 很 有 
可 能 会 在 查找 同一 个 对 象 的 同时 ， 以 某 种 会 对 你 造成 影响 的 方式 修改 这 个 对 象 。 在 Erlang 中 ， 我 
们 力图 明确 区 分 何 时 引用 的 是 会 随时 间 变 化 的 数据 ， 何 时 引用 的 是 简单 的 不 可 变数 据 。 


2.14.2 ETS 表 的 基本 用 法 


标准 库 中 的 ets 模 块 可 用 于 创建 和 操控 ETS 表 。 要 创建 新 表 ， 可 以 调用 ets:new(Name， 
options) 函数 。 其 中 名 称 Name 必 须 是 原子 , options 必 须 是 列表 。 除 非 设 置 nameda_table 选 项 ， 
否则 名 称 不 起 实际 作用 〈 因 此 可 以 创建 多 张 同 名 表 ); 然而 对 于 系统 调试 来 说 ， 在 碰 到 诡异 的 不 
知 潜伏 在 何人 处 的 表 时 , 表 名 可 以 有 效 地 辅助 定位 ， 因 此 在 命名 时 最 好 采用 更 有 意义 的 名 称 ， 比 如 
当前 模块 名 ， 而 不 要 用 table 或 foo 之 类 毫 无 益处 的 名 称 。 

ets :new/2 会 返回 一 个 表 标 识 符 ， 用 于 完成 针对 新 创建 的 表 的 各 种 操作 。 例 如 ， 以 下 代码 将 
创建 一 张 表 并 癌 表 中 写 入 两 个 元 组 : 
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T = ets:newlmytable,[]}, 
ets:insert{(T, {17, hello}), 
ets:insert (T, {42, goodbye},) 


ETS 表 和 数据 库 的 为 一 个 相似 点 在 于 , 它 同 样 只 存储 数据 行 一 一 也 就 是 元 组 ,存储 任何 Erlang 
数据 之 前 ， 都 要 先 将 之 放 入 元 组 。 其 原因 在 于 ETS 会 将 元 组 中 的 一 个 字段 用 作 表 索引 ， 默 认 采 用 
第 一 个 字段 。( 可 以 通过 建 表 参数 调整 。) 这 样 你 便 可 以 按 第 一 列 元 素 在 表 中 查找 数据 行 : 

ets:lookup{(T, 17,) 

这 将 返回 [{17，hel1lo}]。 慢 看 ， 为 什么 结 琳 被 放 在 列表 中 呢 ? 嗯 ，ETS 表 不 一 定 非 要 是 
数据 行 的 集合 ( 所 有 的 键 部 唯一 )， 这 只 是 默认 配置 表 也 可 以 是 bag ( 允许 多 个 行 具 有 相同 的 键 
但 不 允许 出 现 完全 相同 的 行 ) 甚至 duplicate bag ( 允许 出 现 完全 相同 的 行 )。 在 这 些 情况 下 ， 查 找 
结果 可 能 不 止 一 行 。 但 无 论 是 哪 种 情况 ， 查 不 到 匹配 的 行 时 都 会 返回 空 

有 关 ETS 表 还 有 很 多 东西 要 学 。 建 表 时 你 可 以 指定 很 多 参数 ， 还 有 大 量 用 于 搜索 、 过 历 的 强 
盈 拨 口 ， 以 及 很 多 。 后 续 我 们 还 会 在 第 6 草 接触 它们 。 


2.15 ”以 过 归 代 蔡 循 环 


可 能 你 已 经 注意 到 了 ， 除 列表 速 构 以 外 ， 这 门 语言 别 无 其 他 迭代 结构 。 原 因 在 于 Erlang 靠 递 
归 郴 数 调 用 代替 了 和 迭代。 虽然 与 我 们 惯用 的 手法 不 太一 样 , 但 其 中 并 无 奥妙 。 不 过 你 仍然 有 必要 
了 解 一 下 相关 细节 和 技术 , 这些 知识 可 以 在 你 还 不 习惯 这 种 思维 方式 时 帮助 你 更 轻松 地 学 习 ， 同 
时 也 有 助 于 避免 常见 错误 从 而 写 出 坚实 的 代码 。 

入 门 期 间 ,， 先 来 点 儿 简 单 的 ,不 妨 来 算 算 0 到 N 的 累加 和 。 这 个 问题 描述 起 来 很 简单 : 要 计算 
0 到 XN 的 累加 和 ， 只 要 先 算 出 0 到 XI 的 累加 和 ， 再 加 上 N 即 可 。 如 果 N 本 身 就 是 0， 累 加 和 就 是 0。 
写成 Erlang 国 数 就 是 (请 将 之 加 入 my_modqdule .erl ): 


Sum(0) -> 0: 
SUmMm(N}) -> sum(N-1) + N. 


简单 得 不 能 再 简单 了 ， 是 吧 ? 从 来 没 用 过 递归 ? 没关系 ， 这 个 概念 非常 目 然 。( 反 倒是 那些 
夹杂 着 break 和 continue 的 散人 套 for 御 环 之 类 的 老 古 董 一 一 那些 往往 才 是 让 人 绞 尺 脑汁 的 东西 。) 
但 为 了 掌握 各 种 迭代 算法 的 递归 写法 , 我 们 仍然 有 些 基 础 知识 要 学 。 这 些 内 容 很 关键 ,还 请 少 安 
坟 躁 。 


2.15.1 ”从 迭代 到 违 归 


所 有 递归 问题 都 可 转换 为 相应 的 迭代 形式 〈 但 需要 你 自行 处 理 一 些 短 记 工 作 )。 究 竞选 择 哪 
种 方式 ， 这 取决 于 你 所 使 用 的 编程 语言 的 文 持 力度 以 及 最 终结 果 的 效率 。 有 些 语 言 ， 比 如 各 种 老 
式 Basic 方 言 、Fortran-77 或 机 需 汇 编 语 言 ， 完 全 不 支持 递归 。Pascal、C/C++ 、jJava 等 很 多 语言 支 
持 递 归 ， 但 由 于 实现 层面 的 限制 和 低 效 ， 递 归 的 作用 难以 得 到 发 挥 。Erlang 则 不 同 : 它 仅 靠 递归 
就 可 以 创建 循环 ， 而 且 没 有 效率 问题 。 
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1. 老式 循环 
有 时 ,你 会 选择 从 送 代 型 代码 看 手 ( 也许 只 是 在 脑海 中 构思 )， 再 答 试 换 用 Erlang 来 实现 。 下 
面 这 段 用 C 或 Java 写 成 的 计算 0 到 n 的 累加 和 的 代码 就 很 典型 其 中 n 为 输入 参数 : 


int sum(int n) f{ 


int total = 0; 

while (n != 0) { 
total = total + n; 
ni 二 nn 1: 


) 


return total; 
} 
这 上段 代码 展示 了 一 种 过 程式 的 算法 表达 方式 : 采用 这 种 方法 , 你 可 以 在 脑海 里 逐步 跟踪 程序 的 执 
行 并 观察 状态 的 变化 ， 直 至 程序 结束 。 
但 是 请 考虑 一 下 , 要 想 用 大 日 话 尽 可 能 准确 地 回 别 人 描述 这 个 算法 又 该 怎么 说 呢 ? 可 能 你 会 
这 么 说 : 
(1) 整数 N 已 知 ， 令 Total 为 零 ; 
(2) 当 N 不 等 于 零 时 ， 
a) Total 加 N 
b) N 减 1 
c) 重复 第 (2) 步 
(3) 结束 ，Total 即 为 最 终结 果 。 
2. 函数 式 循环 
现在 ， 来 看 看 第 (2) 步 的 另 一 种 表述 方式 。 
和 右 N 不 等 于 地， 代 人 下 列 新 值 重复 本 步 : 
a) 将 TotalL 更 新 为 TotalL+N; 
b) 将 N 更 新 为 N-1。 
这 样 一 来 ， 第 (2) 步 就 变 成 了 一 个 以 变量 N 和 Total 为 参数 的 递归 轴 数 。 该 国 数 不 依赖 其 他 任 
何 信 息 。 每 次 递归 调用 时 ， 只 需要 传人 新 的 参数 值 促成 下 次 迭代 ， 原 参数 值 则 可 以 下 接 抛 弃 。 人 
们 很 容易 通过 “用 不 同 的 参数 值 重复 同一 步骤 ”的 说 法 来 理解 迭代 。( 小 孩子 理解 起 来 通常 没 什 
么 问题 ; 反倒 是 我 们 这 些 多 年 浸 淫 于 过 程式 编程 的 大 人 会 统 尽 脑 计 。) 我 们 来 看 看 这 一 步 写成 
Erlang 是 什么 样子 : 
step_two(N, Total)} when N =/= 0 -> step_two(N-1], Total+N). 
一 看 丈 届 ， 是 吧 ? ( 请 将 这 个 咀 数 加 到 my module.erl 中 。) 请 注意 ， 可 千 万 别 写 出 N=N-1 这 
类 用 法 一 一 这 在 Erlang 中 行 不 通 : 一 个 数 无 法 等 于 它 目 身 减 1。 你 只 能 说 “以 N-1 为 新 的 N、 以 
Total+N 为 新 的 Total 来 调用 step_two”。 不 过 好 像 还 漏 了 点 儿 什 么 ?” 任务 完成 后 该 怎么 办 呢 ? 
我 们 给 这 个 函数 再 加 一 个 子 句 (同时 也 换 一 个 更 贴切 的 名 学 ): 


do sum({N, Total} when N =/= 0 -> do sum(N-1, Total+N): 
do sum(0, Total} -> Total. 
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实际 上 就 是 将 上 面 第 (3) 步 的 文字 描述 翻译 成 了 代码 。 一旦 第 一 个 子 名 匹配 不 上 (保护 式 返回 
false )， 第 二 个 子 句 便 会 生效 ， 该 子 句 只 需 生 接 返 回 rotal 中 的 结 采 即 可 。 

3. 循环 的 初始 化 

现在 该 处 理 第 1 步 了 : 将 Total 置 为 初 信 0。 很 明显 只 要 在 某 处 调用 ao_sum(N，0) 即 可 。 但 
是 在 哪儿 呢 ? 实际 上 还 有 一 个 第 零 步 , 也 就 是 对 问题 本 里 的 描述 :“ 计 算 0 到 和 N 的 累加 和 。” 也 就 是 
do_sum(N) ， 对 吧 ? 要 计算 do_sum(N) ， 只 需 计算 qo_sum (N，0)， 也 束 是 

do_sum{(N) -> do_ suml(N, 0). 

请 注意 一 下 你 刚 完成 的 事情 :你 创建 了 一 个 只 有 一 个 参数 的 函数 ， 名 为 4o_sum/1 ( 注意 
义 末尾 的 句号 ) 该 函数 调用 了 具有 两 个 参数 的 ao_sumy/2。 回 想 一 下 ,在 Erlang 中 这 是 两 个 完 
不 同 的 函数 。 该 例 中 ， 参 数 较 少 的 那个 被 当 作 前 端 ， 另 一 个 则 不 应 该 直接 骏 露 给 用 户 。 因 此 ， 
有 aqo_sum/1 才 应 该 出 现在 模块 的 导出 列表 中 。( 我 们 将 这 两 个 冰 数 命名 为 ao_sum 是 为 了 避免 跟 
本 节 开 头 的 sum 师 数 重 名 ， 你 应 该 把 sum/1 和 dao_sum/1 都 加 进 模 块 ， 再 看 看 针对 同一 个 N 它 们 能 
否 得 出 相同 的 结 末 。) 


























定 
全 
内 








4. 终 曲 
我 们 来 总 结 一 下 这 两 部 分 实现 ， 同 时 做 出 一 些 改进 . 
do_sum(N}) -> do _ suml(N, 0}). 


do_sum(0, Total} -> Total; 
do_sum({N, Total} -> do sum(N-1, Total+N). 


看 明 上 自 怎么 回 事 了 吗 ? 在 上 一 厂 的 递归 机 数 中 我 们 不 过 是 逐 字 逐 句 地 将 “N 不 等 于 地” 翻 详 
成 了 代码 ,而 在 这 个 版 本 中 我 们 调整 了 子 句 的 顺序 ,这样 一 来 每 次 调用 都 会 完 对 基准 情况 (不 涉 
及 递归 调用 的 子 句 ) 进行 判定 。 就 这 个 算法 而 言 ， 这 种 手法 进一步 简化 了 代码 : 第 一 个 于 句 试 图 
将 N 枉 0 匹配 。 奋 匹配 失败 ，N 就 不 会 是 堆 ， 此 时 再 转 人 第 二 种 情况 就 无 顷 保 护 式 了 。 

这 一 节 可 真 够 长 的 , 但 还 没完 ,为 了 带 助 你 理解 一 些 要 点 ,我 们 还 有 一 些 功 谍 要 做 , 并且 还 
要 给 你 刚才 运用 过 的 技巧 命名 。 首 先 我 们 来 讨论 一 下 sum 和 go_sum 所 用 的 两 种 递归 。 














2.15.2 ”理解 尾 违 归 


递归 调用 可 分 为 两 类 : 尾 递 归 和 非 尾 递归 〈 有 时 也 叫做 body recursion )。 本 市 开头 的 sum 也 | 
数 就 是 一 个 非 尾 递归 上 数 〈 因 为 含有 非 尾 递归 调用 )。 在 许多 其 他 语言 中 ， 你 能 接触 到 的 只 有 这 
种 递 卢 ， 因 为 其 他 情况 下 的 递归 往往 可 以 用 各 种 循环 结构 来 代 答 。 

从 循环 迭代 中 推导 来 的 do_sum/2 则 是 尾 北 归 函 数 。 其 中 所 有 递归 调用 都 是 尾 调 用 。 尾 调用 
很 容 多 识别 ， 编 译名 总 能 从 代码 中 准确 地 定位 尾 调 用 ， 并 做 出 一 些 相应 的 特殊 处 理 。 

二 者 之 间 区 别 何在 呢 ?” 如 采 是 尾 调 用 ， 哨 数 在 调用 完成 后 束 无 事 可 做 了 (除了 返回 )。 比 较 
一 下 sum 和 qdo_sum 这 两 个 水 数 的 也 数 体 : 


SUM(IN} -> Sum(N-1) + N. 

















do_sum({N, Total} -> do sum(N-1, Total+N). 
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在 sum 中 , sum(N-1) 调 用 完成 后 , 在 返回 之 前 还 有 一 些 未 尽 事宜 : 即 加 Ne 另 一 边 , 在 do_sum 
中 ，gdo_sum(N-1，Total+N) 调 用 完成 后 便 万 事 大 吉 这 次 递归 调用 的 返回 值 就 是 整个 也 数 
的 返回 值 。 凡 是 符合 这 个 特征 的 调用 就 是 尾 调用 ， 或 称 “ 最 终 调用 "”。 尾 调用 与 递归 与 否 〈 调用 
方 和 被 调用 方 为 同一 个 函数 ) 无 关 一 一 尾 递 归 只 是 尾 调用 的 一 个 特例 , 但 同时 也 是 最 为 重要 的 一 
种 。 你 能 找 出 位 于 sum 孙 数 体 中 的 尾 调用 吗 ? ( 没 错 ， 就 是 +。 ) 

尾 调用 优化 ， 值 得 信赖 

你 大 概 知 道 ,每 个 进程 在 颁 后 都 有 一 个 栈 , 用 于 跟 踊 程序 执行 过 程 中 的 那些 后 绪 还 需要 回 过 
头 来 处 理 的 东西 《比如 说 “ 记 着 一会儿 还 要 回 到 这 个 地 方 来 加 NW”)。 栈 是 一 种 后 人 先 出 的 数据 结 
构 ， 就 像 一 把 一 份 压 者 一 份 的 执行 记录 ， 当 然 ， 如 果 你 一 下 记录 新 的 内 容 ， 最 终 会 耗 尺 内存。 这 
将 非常 不 利于 程序 的 持久 运行 ,那么 Erlang 是 怎么 仅 靠 递 归来 实现 循环 的 呢 ? 每 次 调用 不 是 都 要 
往 栈 上 写 人 新 的 内 容 吗 ? 答案 是 否定 的 ， 因 为 Erlang 采 用 了 尾 调 用 优化 。 

尾 调 用 优化 的 意思 是 ， 当 编译 天 识别 出 尾 调 用 〈 贞 数 返回 前 的 最 后 一 个 任务 ) 时 ， 会 生成 一 
段 特 殊 的 代码 , 这 段 代 码 会 在 执行 尾 调用 之 前 从 栈 中 扎 挥 当前 调用 的 所 有 信息 。 此 时 当前 调用 基 
本 无 事 可 做 ， 只 需 告知 被 调用 的 男 数 后 续 即 将 发 生 一 次 尾 调 用 :“ 嘿 ! 完事 儿 的 时 候 直 接 把 结 
告诉 我 的 调用 者 就 行 了 , 我 收工 了 哦 。 因此 ， 尾 调用 不 会 导致 栈 的 膨胀 。( 作为 特例 ， 调 用 相同 
国 数 的 尾 递 归 调 用 可 以 重用 栈 顶 的 调用 信息 ， 省 得 扔 反 之 后 还 要 再 重新 创建 。) 本 质 上 ， 尾 调用 
只 是 “在 必要 时 清理 一 些 东 西 ， 然 后 执行 跳 转 ”。 

下 是 基于 这 个 原因 , 尾 递 归 困 数 即 便 不 停 不 软 地 运行 也 不 会 将 栈 空间 耗 尽 ,同时 还 能 达到 和 
while 循 环 一 样 高 的 效率 。 





















































2.15.3 ”累加 器 参数 


比较 前 面 的 sum 和 dao_sum 的 行为 ， 可 以 发 现 对 于 同一 个 数 N，sum 将 工作 拆 成 了 两 半 ， 一 半 
负责 从 N 倒 数 到 零 ， 同 时 在 栈 上 记录 后 续 要 累加 的 数值 ; 另 一 半 则 负责 从 栈 记 录 中 找 出 相应 的 数 
值 并 执行 累加 直至 栈 被 清空 。 另 一 边 ，dqo_sum 只 在 栈 上 保留 一 份 记 录 ， 但 它 会 不 断 更 新 该 记录 
直至 N 递 减 为 零 。 随 后 这 份 记录 可 以 直接 丢弃 ， 同 时 Total 成 为 最 终 的 返回 值 。 

在 这 个 例子 中 ，Total 扮 演 了 累加 器 参数 ( accumulator parameter ) 的 角色 ， 用 于 在 单个 变量 
中 和 完成 信息 累加 ( 而 不 是 将 信息 记 在 栈 上 回头 再 来 取 )。 编写 尾 递 归 也 数 时 ， 往 往 需 要 至 少 一 个 
这 样 的 额外 参数 , 有 时 还 会 涉及 多 个 。 这些 变 量 必须 在 循环 启动 时 初始 化 , 因此 你 需要 两 个 油 数 ， 
一 个 用 作 前 端 接口 ， 一 个 用 作 主 循环 。 最 终 ， 用 于 保存 循环 过 程 中 的 临时 信息 的 参数 将 被 丢弃 ， 
其 他 参数 则 会 成 为 最 终 返 回 值 的 一 部 分 。 


























2.15.4 ” 谈 谈 效率 


一 般 来 说 尾 递 归 方案 比 对 应 的 非 尾 递归 方案 更 为 高 效 , 但 不 绝对 , 这 取决 于 具体 的 算法 。 非 
尾 递 归 函 数 比较 懒 , 只 会 将 栈 和 各 种 需要 后 续 回 过 头 来 处 理 的 东西 扔 给 系统 , 尾 递 归 版 本 则 老 老 
实 实地 将 达成 任务 目标 所 需 的 各 种 信息 记 在 素 加 从 变量 中 , 这 些 信息 一 般 被 组 织 为 列表 等 数据 结 
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构 。 如 果 把 非 尾 递归 涵 数 比 作 徘 扔 纸 片 作为 路 标 才 回 得 了 家 的 醉 汉 ， 尾 递归 卫 数 就 是 将 所 有 家 
当 都 狐 进 推 车 里 的 旅 者 。 如 果 所 需 的 最 终结 果 只 是 一 个 数值 ,就 像 sum/ do_sum 的 例子 那样 ， 那 
么 旅 者 会 大 大 胜出 ， 因 为 负担 不 重 跑 起 来 很 轻松 。 但 如 果 结 果 需 要 追踪 的 信息 很 复杂 ， 跟 醉 汉 
无 偿 获 得 的 信息 量 差不多 , 旅 者 就 必须 目 行 完成 一 些 复 洒 的 数据 管理 工作 , 导致 最 终 反 而 可 能 慢 
上 Hs 

总 之 , 有 些 问 题 用 非 尾 圳 归 也 数 解决 起 来 更 下 接 ， 有 些 则 明显 应 该 采用 尾 圳 归 。 作为 脑力 练 
习 , 不 妨 两 种 方法 都 试 试 , 但 对 成 品 代码 而 言 , 我们 建议 你 在 尾 递 归 和 非 尾 递 归 实 现 中 选择 更 可 
读 、 更 易 维 护 、 你 更 有 把 握 正 确实 现 的 方式 。 事 成 之 后 ,就 去 干 点 儿 别 的 吧 。 别 把 时 间 浪 费 在 过 
时 的 优化 上 ， 尤 其 是 以 可 读 性 为 代价 的 优化 。 

当然 , 很 多 情况 下 其 实 没有 什么 选择 余地 : 用 到 无 穷 循环 的 哨 数 就 只 能 采用 尾 递 归 。 我 们 称 
这 类 函数 在 运行 时 空间 消耗 恒定 ( constant space )， 也 就 是 说 ， 即 便 曙 数 永 不 返回 ， 其 内 存 占 用 
量 也 不 会 随时 间 的 流逝 而 增加 。 























2.15.5 ”编写 迎 归 函 数 的 窑 门 


笠 试 用 递归 编程 解决 问题 时 , 新 手 往往 会 觉得 头脑 一 片 空 日 
手 。 下 面 就 教 你 一 些 入 门 的 方法 。 

作为 示范 , 我们 找 了 一 个 你 总 要 以 各 种 方式 去 解决 的 具体 问题 数据 结构 遍历 。 此 处 我 们 考 
察 的 是 列表 , 但 其 思想 同样 也 适用 于 各 种 递归 数据 结构 ， 比 如 由 元 组 构成 的 树 。 你 的 任务 是 反 转 
一 个 列表 ,或 者 说 ， 针 对 给 定 列表 (长 度 任意 ) 创建 一 个 逆序 版 本 的 新 列表 。 要 解决 这 个 问题 ， 
势必 要 遍历 原 有 列表 中 的 所 有 元 素 ， 因 为 它们 都 会 在 结 采 中 出 现 。 

1. 参看 样本 

如 采 不 知道 该 从 何 处 下 手 , 你 可 以 先 罗 列 几 个 简单 的 输入 样本 及 其 对 应 的 结果 。 人 针对 列表 反 
转 ， 可 以 罗列 出 下 列 样本 : 





感觉 根本 不 知道 该 从 何 处 下 























呈 | —> [] 
[Xx] 一 [XxX] 
[x,Yy | 一 [Yy,Xx] 


[x,yY,2] |Z,Y,xXx. 

这 可 不 是 手 到 擒 来 嘛 , 没 错 , 不 过 要 想 看 出 递归 模式 ,把 它们 写 下 来 要 比 全 徘 脑子 想 更 为 容 
易 , 也 可 以 让 问题 更 加 具体 。 它 还 能 促使 你 多 考虑 一 些 特殊 用 例 。 如 果 喜 欢 测试 驱动 开发 ， 你 还 
可 以 立即 将 这 些 用 例 号 入 单元 测试 。 

2. 基准 情况 

接 下 来 ， 你 应 该 写 下 基准 情况 并 明确 在 这 些 情况 下 都 应 该 发 生 些 什么 。( 基准 情况 就 是 那些 
不 涉及 递归 调用 的 情况 。 通 稼 基准 情况 只 有 一 个 ， 但 有 时 也 会 出 现 多 个 。) 对 于 列表 反 转 问题 ， 
你 可 以 将 上 述 样本 的 前 两 个 用 作 綦 准 情 况 。 不 妨 给 你 的 新 函数 rev/1 (请 放 人 my_module ) 写 两 





























个 子 句 看 看 : 
rev([]) -> []:; 
rev({[X]j)} -> [X]. 
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这 两 行 代码 离 竣工 还 差 得 远 ， 但 借助 它们 你 至 少 可 以 立即 着 手 测 试 一 些 简 单 用 例 ， 比 如 
rev([])、rev([17]) 、rev(("hello")) 和 rev([foo]l)。 列 表 元 素 的 类 型 不 重要 ， 我 们 只 在 
乎 顺序 。 

走 完 这 一 步 ， 好 戏 才 开演 : 这 回 你 必须 搞定 递归 。 

3. 数据 的 形态 

现在 开始 分 析 其 余 的 情况 以 及 它们 的 构造 方法 。 如 果 一 个 列表 不 符合 上 述 两 种 基准 情况 , 那 





么 可 以 肯定 它 至 少 含有 两 个 元 系 一 一 也 就 是 说 ， 它 会 呈现 为 [A，B，..:.] 的 形态 。 我 们 知道 ， 
列表 是 由 形 如 [... |...] 的 列表 单元 构成 的 (参见 前 面 的 2.2.5 太 ) 单独 罗列 出 每 个 单元 ， 列 表 
就 会 呈现 出 如 下 的 形态 : 

LF Ta 

换言之 , 每 个 元 系 都 占用 一 个 独立 的 蛙 元 。 不 妨 将 它 用 作 你 的 rev 孙 数 的 第 一 个 子 句 ( 试 一 下 ): 

rev([IA | [B | TheRest] ]) -> not yet_ implemented; 


回忆 一 下 ， 销 数 的 首部 是 一 个 模式 ， 用 于 实 参 的 匹配 和 分 解 ( 参见 2.5.4 市 )。 你 会 看 到 一 些 
针对 A、B、TheRest 等 无 用 变量 的 警告 ， 子 句 的 正文 什么 也 没 干 , 仅仅 返回 了 一 个 用 于 说 明 “ 功 
能 尚未 实现 ”的 原子 。 但 至 少 rev 国 数 现在 已 经 可 以 接受 包含 两 个 或 两 个 以 上 元 素 的 列表 了 。 

接 下 来 ， 你 得 想 清 楚 怎 么 处 理 这 种 情况 。 很 明显 ， 这 里 会 涉及 针对 rev 的 递归 调用 。 

4. 假设 有 现成 的 函数 可 用 

如 条 从 数据 的 样本 和 结构 中 仍然 找 不 出 头绪 〈 别 担心 ， 勤 加 练习 后 情况 就 会 好 很 多 )， 或 者 
明明 已 经 看 到 了 轮廓 但 就 是 裔 不 定 细节 ， 那 么 教 你 一 个 窗 门 ， 告 诉 自 己 :“ 我 已 经 有 一 个 现成 的 
可 工作 的 男 数 了 ， 就 在 那儿 ， 我 只 是 要 写 一 个 新 的 《更 好 的 ) 完成 同样 功能 的 因数 。” 在 编写 目 
己 的 新 郧 数 时 ， 准 许 你 采用 老 的 版 本 来 做 试验 。 

不 妨 假设 : 老 版 本 的 图 数 名 为 olda_rev/1。 好 ! 要 把 not_yet_implemented 蔡 换 成 更 有 意 
义 的 东西 ,你 该 怎么 办 ”有 变量 A、B 和 TheRest 在 手 , 你 想 要 一 个 包含 同样 元 素 的 列表 ， 只 是 顺 
序 相反 。 如 果 能 (用 ola_rev ) 反 转 TheRest， 青 在 列表 末尾 加 上 B 和 A ( ++ 可 用 于 拼接 两 个 列 
表 )， 岂 不 就 成 了 ” 束 像 这 样 : 

rev([A | [B | TheRest] ]) -> old rev(TheRest) ++ [B, Al]; 

人 够 简单 的 吧 ! 现在 ,你 的 晒 数 看 似 已 经 可 以 正确 处 理 任 意 长 度 的 列表 了 。 既 然 它 已 经 可 以 完 
全 胜任 ， 定 然 不 比 ola_rev 差 ， 那 么 就 换 上 你 目 己 的 rev 吧 ! 于 是 整个 隐 数 变 成 了 这 样 . 






































rev([A | [B | TheRest] ]) -> rev(TheRest) ++ [B, Al]; 
rev([]) -> |[],; 
rev([X]) -> [Xj]. 


试 试 my_mogdule:rev([1,2,3,4]), 一 切 正常 ， 漆 亮 ! 下 一 步 ， 我 们 来 看 看 如 何 证 明 这 个 
国 数 的 确 适 用 于 所 有 列表 。 

5. 可 终止 性 证 明 

有 些 函 数 我 们 一 眼 就 能 看 出 它 迟 早 会 结 无 论 什 么 输入 都 不 会 让 它 陷 入 死 循环 ,但 对 于 
更 复杂 的 函数 ,我们 很 难看 出 它 最 终 是 否 一 定 能 在 某 处 返回 。 
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论证 函数 可 终止 性 的 主要 线索 就 是 单调 递减 参数 。 它 的 意思 是 , 假设 基准 情况 对 应 于 函数 可 
接受 的 最 小 输入 ， 而 递归 情况 处 理 其 他 所 有 较 大 的 输入 , 那么 ， 只 要 每 种 递归 情况 都 在 缩小 递归 
调用 的 输入 ， 你 就 知道 输入 参数 最 终 一 定 能 归结 到 基准 情况 ， 于 是 函数 必然 可 以 终止 。 但 奋 某 个 
递归 调用 传 入 了 相等 甚至 更 大 的 输入 ， 就 很 值得 怀疑 了 ， 必 须 仔细 考察 。( 对 于 在 多 个 参数 上 递 
归 的 函数 ， 至 少 要 有 一 个 参数 在 其 他 参数 不 递增 的 前 提 下 递减 才 行 。) 当然 ， 像 办 加 帮 参 数 这 种 
与 循环 判定 条 件 无 关 的 参数 可 以 忽略 。 

在 rev 的 例子 中 ， 参 数 不 可 能 比 基 准 情况 更 小 。 再 看 递归 情况 ， 可 以 看 到 在 递归 调用 
rev (TheRest) 时 ，TheRest 所 包含 的 元 素数 少 于 当前 输入 参数 中 以 A、B 开 头 的 列表 的 元 系数 。 
由 此 可 得 ， 要 处 理 的 列表 在 相继 缩短 ， 于 是 你 便 知 道上 自己 绝 不 会 陷 和 人 和 死 循环 。 

针对 数值 做 递归 时 , 正如 本 市 开头 处 的 sum 的 例子 , 人 们 很 容易 忘记 整数 没有 下 限 这 个 事实 。 
回 过 头 来 观察 sum 的 定义 ， 可 以 看 到 在 递归 情况 下 传 给 下 次 递归 调用 的 数值 总 是 小 于 当前 输入 ， 
因此 输入 参数 最 终 必 然 会 递减 为 零 或 更 小 的 值 。 但 如 果 传 人 的 参数 一 开始 就 小 于 零 ， 比 如 调用 
sum(-1) ， 困 数 就 会 开始 用 -2、-3、-4 等 持续 不 断 地 调用 肯 己 ， 直 至 内 存 被 某 个 巨大 的 负数 耗 尽 
为 止 "。 为 了 避免 发 生 这 种 情况 ， 你 可 以 给 递归 情况 加 上 保护 式 when N > 0， 从 而 确保 在 输入 
参数 为 负数 时 无 法 命中 任何 子 句 。 

输入 参数 是 大 还 是 小 , 是 由 函数 的 上 下 文 决定 的 。 例 如 让 整数 N 从 1 递归 到 100, 这 时 最 “小 ” 
情况 就 是 100， 同 时 N+1“ 小 于 ”N。 关 键 在 于 每 次 递归 调用 都 能 向 基准 情况 迈进 一 步 。” 

6. 基准 情况 最 小 化 

尽管 多 个 基准 情况 的 存在 并 不 会 妨碍 功能 实现 , 但 这 会 困扰 后 续 的 代码 维护 人 员 。 如 果 丰 的 
人 碰 到 不 止 一 个 基准 情况 , 不 妨 试 试看 能 否 干 滔 利 落地 进行 一 些 裁 前 。 在 上 面 的 例子 中 你 罗列 了 两 
个 基准 情况 : [] 和 [x] ， 因 为 这 两 种 情况 看 起 来 最 简单 。 但 如 采 将 [X] 也 看 作 列 表单 元 ， 便 会 发 
现 它 可 以 写作 : 

[和 | 0 

由 于 rev 已 经 可 以 处 理 空 表 ， 于 是 *ev([X] ) 可 以 归结 为 rev([]) ++ [X] 。 看 起 来 好 像 没 
什么 必要 , 但 这 样 一 来 你 就 不 用 将 包含 单个 元 素 的 列表 和 包含 两 个 或 两 个 以 上 元 系 的 列表 区 分 为 
两 种 独立 的 情况 来 考虑 了 。 两 条 规则 合 二 为 一 ， 便 得 出 了 一 个 更 为 清晰 的 方案 : 


rev([X | TheRest]) -> rev{(TheRest) ++ [X]: 
rev([]) -> []. 


(注意 此 处 子 句 的 顺序 并 不 重要 : 列表 要 么 空 要 么 非 空 ， 只 有 一 个 能 够 命中 。 但 我 们 没 必 要 
先 检查 空 表 ， 对 于 含有 100 个 元 素 的 列表 ， 前 100 次 递归 调用 处 理 的 都 是 非 空 表 ， 空 表 只 会 出 现 
一 次 。 ) 















































J 此 处 内 存 确实 会 被 撑 爆 ， 但 不 是 源 自 某 个 巨大 的 负数 ， 而 是 因为 sum 的 栈 空间 被 撑 爆 。 一 一 译 者 注 

@ 这 几 个 段落 中 的 “大 “小 ”概念 用 得 比较 含糊 。 作 者 的 意思 应 该 是 将 基准 情况 所 覆盖 的 输入 当 作 “最 小 ”输入 ， 
同时 越 接近 基准 情况 的 输入 越 “ 小 "”。 这 里 的 “大 ”和 “小 ”大 致 可 以 认为 是 在 形容 输入 参数 相 较 于 基准 情况 的 
规模 或 复杂 度 。 一 一 译 者 注 
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7. 识别 平方 复杂 度 的 行为 

现在 , 你 已 经 得 到 了 一 个 正确 的 列表 反 转 函数 。 万事 大 吉 了 吗 ? 还 没 呢 。 如 果 输 入 的 列表 很 
长 ， 这 个 实现 的 耗 时 也 会 相当 长 。 为 什么 呢 ? 因为 你 已 然 踏 人 了 平方 复杂 度 行为 的 雷池 。 假 设 
国 数 处 理 某 个 列表 的 耗 时 为 7 个 单位 (采用 什么 时 间 单 位 都 可 以 ), 平方 复杂 度 意味 着 处 理 长 度 为 
原 列表 两 倍 的 列表 将 耗 时 47 个 单位 ， 处 理 3 倍 长 度 的 列表 将 耗 时 97 个 单位 ， 以 此 类 推 。 列 表 比 较 
短小 时 还 没什么 感觉 , 但 情况 很 快 就 会 失控 。 假 设 你 有 一 个 图 数 ,， 它 会 把 给 定 目录 下 的 所 有 文件 
都 纳入 一 个 列表 然后 进行 处 理 。 哺 数 功 能 正常 , 但 你 处 理 过 的 目录 所 包含 的 文件 数 从 来 就 没有 起 
过 100 个 。 处 理 100 个 文件 只 需 1/10 秒 ， 问 题 不 大 。 然 而 如 果 采 用 了 平方 时 间 复 杂 度 的 算法 ， 某 天 
你 把 它 用 在 某 个 包含 10 000 个 文件 的 目录 上 时 (是 足 是 以 前 的 100 倍 ), 耗 时 将 会 是 以 前 的 100 x 100= 
10 000 倍 (超过 15 分 钟 )。 与 此 同时 ， 采 用 耗 时 与 输入 规模 成 正比 的 算法 ， 或 者 说 是 线性 复杂 度 
的 算法 ， 只 要 10 秒 钟 。 客 户 很 生气 ， 后 果 很 严重 。 

为 什么 你 实现 的 *ev 会 有 平方 级 的 时 间 复 杂 度 呢 ? 因为 在 每 次 递归 调用 中 ( 每 个 列表 元 素 一 
次 )， 你 都 用 到 了 ++ 运 算 符 ， 而 它 的 执行 时 间 与 运算 符 左 侧 的 列表 长 度 成 正比 (参见 2.2.5$ 节 )。 假 
设 左 侧 列表 长 度 为 1 时 ++ 的 耗 时 为 T。 在 你 的 rev 函 数 中 ， 位 于 ++ 左 侧 的 是 递归 调用 返回 的 列表 ， 
其 长 度 与 输入 列表 相同 。 也 就 是 说 在 长 度 为 100 的 列表 上 执行 ev， 第 一 次 调用 会 耗 时 1007、 第 
二 次 997、 第 三 次 987， 以 此 类 推 ， 直 到 递减 为 1。( 每 次 调用 还 会 耗费 一 小 部 分 时 间 用 于 切 分 x 和 
TheRest 并 执行 递归 调用 ,但 与 1007 相 比 ， 这 部 分 时 间 可 以 忽略 不 计 。 ) 

1007+997+987+…+27+17 是 多 少 呢 ? 这 相当 于 是 在 求 边 长 为 100 的 等 腰 直 角 三 角形 的 面积 : 
其 面积 应 为 100 x 10002， 也 就 是 边 长 为 100 的 正方 形 的 面积 的 一 半 。 总 之 ， 处 理 长 度 为 VX 的 列表 ， 
rev 的 耗 时 与 N x M2 成 正比 。 耗 时 如 何 随 X 的 不 断 增 大 而 增长 才 是 我 们 最 为 关心 的 内 容 ， 因 此 我 
们 称 这 个 算法 呈 平 方 复杂 度 ， 因 为 耗 时 呈现 出 了 N x _N 规 模 的 增长 。 与 函数 的 主体 行为 相 比 ， 身 
为 分 母 的 2 实在 是 回 天 乏术 ( 见 图 2-3 )。 
































时 间 





迭代 次 数 
8+7+6+5+4+3+2+1=36 


图 2-3 平方 复杂 度 的 函数 迭代 N 次 后 的 总 耗 时 = 三 角形 的 面积 








J 此 处 及 本 市 后 续 内 容 中 提 到 的 复杂 度 指 的 都 是 时 间 复 杂 度 。 一 一 译 者 注 
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震 要 注意 的 是 , 这 类 由 于 在 某 数据 集 上 进行 循环 或 迭代 而 引发 的 问题 在 所 有 语言 中 都 有 可 能 
发 生 ; 这 不 是 递归 的 错 ， 而 是 因为 你 将 某 个 任务 重复 了 N 次 ， 还 每 次 都 额外 干 些 耗 时 与 N 成 正比 
的 事情 , 这 样 一 来 所 有 耗 时 加 起 来 就 变 成 了 这 么 一 个 三 角形 。 唯 一 的 安奈 是 这 还 不 是 最 坏 的 情况 : 
如 果 你 在 上 个 例子 中 采用 一 个 时 间 复 杂 度 达到 立方 级 别 的 算法 , 那 就 冬 午 坐 等 28 个 小 时 吧 。 要 是 
再 演变 成 指数 复杂 度 ， 可 就 不 仅仅 是 等 的 问题 了 。 

8. 避免 平方 级 别 的 时 间 复 杂 度 

怎样 才能 让 rev 国 数 避 开平 方 时 间 复 杂 度 呢 ? 反正 肯定 不 能 继续 把 变 长 列表 放 在 ++ 运 算 符 
的 左 侧 了 。 尾 递归 能 不 能 解决 问题 呢 ? 同样 是 列表 遍历 , 但 现在 每 走 一 步 都 将 手头 所 需 的 家 当 悉 
数 摆 进 面前 的 参数 里 ,这样 一 来 过 历 一 结束 就 万 事 大 吉 了 : 栈 上 干 干净 净 , 没有 需要 回 过 头 去 处 
理 的 东西 ， 就 像 2.15.1 市 的 4o_sum 一 样 。 按 这 种 方式 来 对 列表 做 递归 如 何 ?” 你 仍然 可 以 采用 编写 
rev 时 分 析出 来 的 基准 情况 和 递归 情况 ， 不 过 新 图 数 将 改名 为 tailrev， 另 外 还 要 增加 一 个 累加 
顺 参 数 用 于 保存 最 终结 果 ， 如 下 : 


tailrev([X | TheRest], Acc) -> not yet implemented:; 
























































tailrev([], Acc) -> Acc， 

现在 来 看 not_yet _implemented 部 分 : 要 构成 尾 递 归 一 定 是 tailrev (TheRest, ...) 
的 形式 ， 且 第 二 个 参数 跟 acc 和 X 有 关 。 你 已 经 掌握 了 价 廉 物美 的 cons 运 算 〈 将 元 素 加 至 列表 左 
侧 )， 你 也 明日 Acc 将 会 成 为 最 终 的 逆序 列表 。 那 么 不 妨 用 [xX | aAcc] 将 元 素 加 到 Acc 的 左 侧 ， 实 
际 上 就 是 在 遍历 的 同时 把 老 列 表 从 右 回 左 再 写 一 过 : 


tailrev([X | TheRest], Acc) -> tailrev(TheRest, [X | Acc]}; 
tailrev{([], Acc} -> Acc. 


这 上 段 代 人 码 在 裔 历 列表 的 同时 将 眼前 的 每 个 元 系 都 加 到 Acc 的 左 侧 ， 下 至 列表 为 空 。 那 么 Acc 
的 初 值 应 该 是 什么 呢 ” 要 搞 明 白 这 一 点 , 最 简单 的 方法 就 是 看 看 在 基准 情况 以 外 的 最 简单 的 情况 
下 函数 会 有 什么 行为 。 不 妨 看 下 这 个 调用 : tailrev([foo]，Acc) ， 反 转 一 个 仅 含 一 个 元 素 的 
列表 。 该 调用 可 以 命中 第 一 个 子 句 ， 于 是 X 和 mheRest 被 分 别 绑 定 为 foo 和 [] ， 子 句 的 正文 也 就 
变 成 了 tailrev([]，[foo | Acc])。 下 一 步 的 递归 调用 就 归结 到 了 基准 情况 tailrev ([]， 
Acc) ， 并 最 终 返 回 Acc。 换 言 之 ，Acc 的 初 值 必须 是 个 空 表 ， 这样 [foo | Acc] = [foo] 才 能 
成 立 。 最 终 的 完整 实现 如 下 ， 其 中 tailrev/1 是 主 入 口 : 


tailrev(List) -> tailrev (List, [|]}. 


























tailrev([X | TheRest], Acc) -> tailrev(TheRest, [X | Acc]): 
tailrev([], Acc) -> Acc. 


为 什么 这 个 实现 就 是 线性 ( 与 列表 长 度 成 正比 ) 而 非 平方 时 间 复 杂 度 呢 ? 因为 处 理 列 表 中 每 
个 元 系 所 知 的 耗 时 都 是 固定 的 (请 如 将 元 系 加 到 列表 左 侧 ); 因此 ,大 列表 含有 Z 个 元 素 ， 总 耗 时 
就 是 L 习 以 C， 其 中 C 是 攻 个 较 小 的 沼 数 ,而 且 在 输入 规模 增 大 时 这 个 算法 的 耗 时 也 绝 不 会 像 平 方 
复杂 度 的 版 本 那样 ， 让 你 眼睁睁 地 看 它 极速 爆炸 。 

9. 小 心 长 度 

在 Java 这 类 语言 中 ,获取 列表 的 长 度 是 一 个 第 数 时 间 复 杂 度 的 操作 。 有 这 类 语言 背景 的 Erlang 
新 手 经 第 会 犯 的 一 个 错误 就 是 在 保护 式 中 调用 内 置 钢 数 lengthn， 如 代码 清单 2-2 所 示 。 
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78 第 2 章 ，Erlang 语 言 精 要 


代码 清单 2-2 ” 别 这 样 做 : lengtn (List) 会 遍历 整个 列表 | 
loop (List}) when length{List) > 0 -> 
do_ something; 





loop (EmptyList) 一 > 
done. 


写成 这 样 的 图 数 , 耗 时 痢 与 列表 长 度 的 平方 成 正比 ,因为 每 回 计 算 列 表 元 系数 日 时 都 要 从 头 
至 尾 遍历 整个 列表 。 所 有 的 耗 时 加 起 来 又 形成 了 一 个 三 角形 , 跟 上 一 小 市 中 ++ 运 算 符 的 耗 时 情况 
类 似 。 但 如 采 只 关心 列表 是 否 为 空 ， 采 用 模式 匹配 即 可 ， 如 代码 清单 2-3 所 示 。 


代码 清单 2.3 ”这 样 做 才 对 : 用 模式 匹配 对 列表 判 空 


loopl[SomeElement | RestOfList]) -> 
do_ something; 

loopll]) =3 
done. 


这 种 匹配 操作 很 快 , 而 且 耗 时 是 固定 的 。 你 甚至 可 以 利用 模式 匹配 来 辨识 不 短 于 指定 长 度 的 
列表 ， 如 代码 清单 2-4 所 示 。 


代码 清单 2-4 ”用 模式 匹配 检查 不 同 长 度 的 列表 























loop([A, B, C | TheRest]) -> three or more; 
loop([A, B | TheRest]) -> two_or_more; 
loop([A | TheRest]) -> one or _ more; 
loop( 


注意 完 检 查 较 长 的 列表 ， 要 是 先 检 查 长 度 大 于 等 于 2 的 列表 的 话 ， 长 度 为 3 的 列表 也 会 命中 。 
忆 之 记得 把 最 特殊 的 模式 放 到 最 前 面 就 是 了 。 


[]) -> none. 














2.16 ”Erlang 编程 资源 


为 了 学习 更 多 的 Erlang 喇 言 的 知识 ， 更 好 地 抓 住 也 数 式 编程 和 并 发 编程 的 精髓 ， 并 学 习 更 多 
的 库 和 工具 ， 我 们 为 你 准备 了 以 下 一 系列 重要 资源 。 








2.16.1 ”图书 


除 本 书 以 外 ， 近 年 来 还 有 两 本 Erlang 编 程 语言 方面 的 书籍 。 其 中 第 一 本 曾 在 全 世界 范围 内 拢 
起 了 一 波 新 的 Erlang 浪 渭 ， 它 就 是 Joe Armstrong 的 Programmine Erlang Sofiware for a 
Concurrent World”( Pragmatic Bookshelf，2007 )。 这 本 书 对 Erlang 语 言 和 并 发 编程 做 了 一 个 很 好 
的 概要 性 介绍 ， 书 中 还 给 出 了 大 量 新 厨 有 趣 又 易于 用 Erlang 实 现 的 程序 示例 。 

第 二 本 的 年 份 更 近 一 些 , 它 就 是 Cesarini 和 Thompson 的 Erlang Proerammine( O’Reilly, 2009 )。 
这 本 书 更 加 次 入 地 介绍 了 Erlang 声 言 的 各 种 细节 和 惯例 、 函 数 式 编程 和 并 发 编程 的 各 种 技术 ， 以 
及 Erlang 牛 态 系统 中 不 可 或 缺 的 各 种 库 和 工具 。 








由 本 书 中 文 版 《Erlang 程 序 设计 》 已 由 人 民 邮 电 出 版 社 出 版 ， 前 面 也 有 提 及 。 一 一 编者 注 
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最 后 ， 如 果 对 Erlang 的 历史 感 兴趣 ， 你 还 可 以 看 看 Armstrong、Virding、Wikstrom 和 Williams 
合 著 的 Concurrent Prograazazzg in Erlang, 2nd ed. (Prentice Hall 1996 ) ”， 不 过 这 本 书 的 内 容 在 
语言 特性 、 库 和 工具 等 方面 部 已 经 过 时 本。 


2.16.2 在线 资料 


Erlang 的 主 站 点 是 www.erlang.org， 在 这 儿 你 可 以 下 载 到 Erlang 的 最 新 开源 版 本 、 阅 读 在 线 文 
档 、 查 阅 来 和 目 爱 立信 OTP 开 发 团队 的 官方 新 闻 、 订 阅 邮 件 列 表 等 ， 不 一 而 足 。 

还 有 一 个 社区 站 点 www.trapexit.org， 提 供 了 邮件 列表 合集 和 wiki 服 务 ， 其 中 周 插 了 教程 、 技 
术 文 草 、 导 3 引 、 参 考 链 接 等 一 系列 内 容 。 男 外 ，www.planeterlang.org 上 还 汇总 了 四 面 八方 的 各 种 
Erlang 相 关 的 feed ， 助 你 随时 洞悉 最 新 态势 。 

Erlang 的 主 邮 件 列 表 是 erlang-questions@erlang.org ， 在 这 儿 ， 即 便 是 最 为 艰 闪 的 问题 往往 也 
能 得 到 资深 专业 用 户 的 解答 。 合 集中 十 几 年 的 沉 演 更 是 无 价 的 信息 宝库 。 

最 后 ,在 www.stackoverflow.com 上 搜索 一 下 “erlang”， 在 寻求 各 种 问题 的 解答 时 ， 这些 内 容 
可 以 作为 erlang-questions 邮 件 列 表 的 绝 佳 补充 。 



































2.17 小结 


本 章 涵 凋 了 大 量 内 容 ， 从 Erlang shell 开 始 ， 到 数据 类 型 、 醒 块 和 函数 、 模 式 匹配 、 保 护 式 、 
fun 国 数 和 开 遂 ， 再 到 列表 速 构 、 比 特 位 语法 、 预 处 理 硕 、 进 程 、ETS 表 、 递 归 等 。 尽 管 在 Erlang 
程序 开发 方面 还 有 很 多 东西 要 学 , 但 本 草 所 洱 盖 的 内 容 已 经 足以 助 你 迈 出 坚实 的 一 步 。 如 果 你 还 
征 Erlang 新 于 ， 略 过 这 章 也 没关系 ; 需要 时 随时 回头 查阅 即 可 。 

在 后 续 的 草 市 中 , 我 们 将 假设 你 已 经 学 握 了 前 面 的 知识 , 并 以 此 为 基础 循序 渐进 地 曾 述 各 种 
新 的 概念 。 现 在 我 们 将 耳 接 深入 OTP， 它 将 是 本 书后 续 内 容 的 主线 ， 而 作为 Erlang 程 序 员 的 你 也 
会 将 它 视 作 忠实 的 伙伴 ( 我 们 衷心 希望 如 此 )。 























GD Prentice Hall 公 开 了 Concurrent Programming in Erlang, 2nd ed. 的 第 一 部 分 。 这 部 分 书稿 由 译 者 于 2009 年 组 织 
CPiE-CN 志 愿 译 者 团队 翻译 完成 ， 参 见 http://cpie-cn.googlecode.com/hg/_build/html/index.html。 一 一 译 者 注 
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开发 基于 TCP 的 RPG 服 务 





本 章 概 要 

口 介绍 OTP 行 为 模式 

口 模块 布局 规范 和 EDoc 标 注 
口 用 TCP/IP 实 现 RPC 服 务 

口 借助 Telnet 和 服务 器 通信 


什么 ! ? 没有 “hello world””? 

没 错 ， 没 有 “hello world”。 我 们 已 经 在 第 2 章 概览 了 Erlang 语 言 ， 现 在 该 用 它 做 些 具体 的 事 
情 了 。 为 了 简单 快速 地 进入 现实 工作 中 的 Erlang， 我 们 对 “hello world” 说 不 ! 正 相 反 ， 你 所 要 
实现 的 都 是 些 能 立即 铂 上 用 场 的 东西 。 你 要 实现 一 个 基于 TCP 的 RPC 服 务 硕 ! 

可 能 你 还 不 知道 这 是 个 什么 玩意 儿 ， 我 们 来 解释 一 下 。RPC 表 示 远 程 过 程 调 用 (remote 
procedure call )。RPC 服 务 硕 令 你 得 以 从 远程 机 关上 发 起 过 程 〈( 也 就 是 因数 ) 调用 。 利 用 这 个 基于 
TCP 的 RPC 服 务 侣 ， 人 们 只 需要 一 个 简单 的 TCP 客 户 端 ( 比如 老式 的 Telnet ) 就 能 连 上 Erlang 方 点 、 
执行 Erlang 命 令 ， 并 检查 执行 结果 。 要 想 对 上 线 投 产后 的 软件 进行 诊断 ， 这 个 TCP RPC 服 务 表 会 
是 一 个 民 好 的 起 点 。 








源码 
本 书 的 源码 托管 于 GitHub。 访问 http://github.com/ 并 搜索 “Erlang and OTP in Action” 即 


可 找到 。 你 可 以 用 git 克隆 整个 代码 库 ， 也 可 以 直接 下 载 源 码 的 zip 压缩 包 。 








将 这 个 RPC 应 用 部 署 到 线 上 服务 条 上 会 造成 一 个 安全 漏洞 , 因为 它 允 许 用 户 在 服务 带 上 执行 
任意 代码 , 不 过 问题 并 不 大 ， 只 需 对 该 工具 可 访问 的 模块 和 函数 进行 限制 即 可 堵 上 这 个 漏洞 。 但 
在 本 章 你 不 必 在 意 这 上 点。 我 们 只 是 想 信 这 个 基本 服务 来 前 述 最 基本 、 最 强大 ， 也 最 和 背 用 的 一 种 
OTP 行 为 模式 : 通用 服务 侣 模式 ， 即 gen_server。( 对 行为 模式 一 词 ， 我 们 采用 的 是 英 式 拼写 
behaviour， 以 期 与 Erlang/OTP 文 档 保 持 一 致 。) 对 于 构建 于 OTP 行 为 模式 之 上 的 软件 而 言 ，OTP 
行为 模式 可 以 大 大 增强 它们 的 稳定 性 、 可 读 性 和 功能 性 。 

在 本 章 中 , 我 们 将 市 你 一 起 实现 你 的 第 一 个 行为 模式 , 你 还 将 学 习 如 何 利 用 gen_tcp 模 块 来 进 
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3.1 你 所 创建 的 是 什么 81 





行 基本 的 TCP 套 接 字 开 发 ( 尽管 从 名 称 上 看 很 像 ， 但 该 模块 并 不 是 一 个 行为 模式 )。 本 书 主要 针 
对 中 级 Erlang 程 序 员 ， 所 以 我 们 会 直 的 黄龙 。 你 可 得 集中 注意 力 ， 当 然 我 们 也 会 保证 本 章 足 够 浅 
显 易 懂 。 待 到 学 成 之 时 ， 在 可 靠 软件 构建 方面 你 将 获得 长 足 的 进步 。 

到 本 章 结束 时 ， 你 的 这 个 Erlang 程 序 也 将 竣工 ， 该 程序 最 终 会 成 为 某 产 品级 服务 的 一 部 分 。 
在 第 4 章 中 ， 借 由 OTP 框 架 这 个 程序 还 会 进一步 成 为 Erlang 应 用 ， 你 可 以 用 它 和 其 他 Erlang 应 用 一 
起 搭建 完整 的 可 交付 投产 的 系统 (也 称 为 发 布 镜像 )。 再 往 后 ， 到 第 11 章 时 ， 你 还 会 在 随后 开发 
的 简易 缓存 应 用 中 集成 一 个 类 似 的 服务 。 那 将 是 一 个 更 健壮 、 可 伸缩 性 更 强 的 TCP 服 务 器 ， 我 们 
还 将 借 此 展现 一 些 和 该 主题 相关 的 有 趣 的 窍门 。 现 在 , 我 们 还 是 先 来 明确 一 下 你 在 这 一 章 所 要 完 
成 的 任务 。 


3.1 你 所 创建 的 是 什么 


该 RPC 服 务 器 会 监听 TCP 套 接 字 并 接受 来 自 外 来 TCP 客 户 端 的 连接 。 建 立 连接 之 后 ， 客 户 
闪 将 可 以 通过 TCP 之 上 的 简易 ASCII 文 本 协议 执行 图 数 调用 。 图 3-1 展 示 了 该 RPC 服 务 右 的 设计 
和 功能 。 















































DH， 口 
TCP 流 量 OO 
(gen server) 


图 3-1 RPC 服 务 需 进程 通过 套 接 字 与 外 界 相连 。 它 通过 TCP 接 收 和 
执行 请 求 ， 并 将 结果 返回 给 客户 端 

该 图 展示 了 两 个 进程 。 一 个 是 我 们 在 第 1 草 中 提 过 的 监督 进程 ， 由 它 派生 出 实际 的 RPC 服 务 
器 进程 。 第 二 个 进程 会 创建 一 个 监听 套 接 字 等 待 其 他 人 的 连接 。 当 连接 到 来 时 ， 它 会 从 连接 上 该 
取 拉 述 普通 Erlang 顶 数 调 用 的 ASCII 文 本 , 并 在 执行 调用 后 将 结果 通过 TCP 流 返回 。 这 类 功能 在 很 
多 场合 都 能 派 上 用 场 , 包括 在 紧要 关头 下 的 远程 管理 和 诊断 。 此 外 , 该 RPC 服 务 需 遵循 建立 在 TCP 
流 之 上 的 一 个 看 似 标 准 Erlang 阴 数 调用 的 基本 文本 协议 。 该 协议 的 一 般 形式 为 : 

Module:Function(Argl, ..., ArgN). 
例如 : 

lists:append{("Hello", "Dolly"). 
(注意 必须 加 上 句号 。) 为 了 解释 这 些 请 求 ，RPC 服 务 絮 会 解析 ASCII 文 本 ， 提 取出 模块 名 、 隆 数 
名 和 参数 ， 并 将 它们 转换 成 合法 的 Erlang 项 式 。 接 着 它 会 执行 请 求 中 的 了 饵 数 调 用 ， 并 将 调用 结 
所 对 应 的 Erlang 项 式 格 式 化 成 ASCI 文 本 ， 最 终 通过 TCP 流 回 传 给 客户 端 。 

要 完成 这 些 工 作 ， 必 须 理解 后 续 两 小 节 所 介绍 的 一 些 Erlang/OTP 的 基础 概念 。 
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82 第 3 章 开发 基于 TCP 的 RPC 服务 


3.1.1 基础 知识 提醒 


你 应 该 已 经 对 模块 、 函 数 、 消 息 和 进程 有 了 些 基 本 的 认识 ,这 些 概念 我 们 在 第 1、2 章 就 已 经 
阐述 过 了 。 在 介绍 新 的 行为 模式 的 概念 之 前 ， 我 们 再 来 回顾 一 下 这 些 概 念 。 首 和 完 ， 在 Erlang 中 ， 
模块 是 函数 的 载体 ， 进 程 依 冰 数 调用 而 诞生 。 进 程 彼此 之 间 通 过 消息 进行 通信 。 图 3-2 展 示 了 这 


些 大 系 。 
es 发 过 
D > 
= 了 > < 
包含 执 yw 
忆 下 被 发 送 至 


图 3-2” 模块、 图 数 、 进 程 和 消息 之 间 的 关系 


证 我 们 再 仔细 回顾 一 下 这 些 概 念 。 

口 模块 一 一 模块 是 代码 的 容 带 。 模 块 既 可 以 将 羡 数 私有 化 ， 也 可 以 将 之 导出 供 外 部 使 用 ， 
模块 通过 这 种 方式 得 以 控制 函数 的 可 访问 性 。 每 个 目标 文件 ( .beam 文 件 ) 仅 含 一 个 模块 。 
奋 模块 名 为 test， 则 模块 所 在 的 源码 文件 名 必须 为 test.erl， 编 译 后 的 目标 文件 名 也 必须 为 
test.beam。 

口 函数 一 一 国 数 是 真正 干 活 的 角色 ,Erlang 模 块 中 的 所 有 代码 都 必须 从 属于 采 个 杖 数 。Erlang 
程序 就 是 由 一 系列 函数 顺序 拼接 而 成 的 。 每 个 因数 必须 从 属于 某 个 模块 。 

口 进程 一 一 进程 是 Erlang 并 发 的 基本 单元 。 它 们 相互 之 间 通 过 消息 进行 通信 。 进 程 也 是 Erlang 
程序 执行 状态 的 基本 容 需 : 它 可 用 于 容纳 会 随时 间 变 化 的 数据 。 每 个 进程 都 可 以 创建 ( 派 
生 ) 新 的 进程 ， 并 指定 新 进程 应 执行 的 函数 调用 。 新 进程 将 执行 该 调用 并 在 调用 结束 时 
退出 。 被 派生 出 来 执行 简单 的 ijo:format/2 调 用 的 进程 会 很 短命 ， 而 被 派生 出 来 执行 
timer:sleep (infinity) 这 类 调用 的 进程 则 永远 也 不 会 退出 ， 除 非 外 力 强行 将 之 终止 。 

口 消息 一 一 消息 是 进程 交互 的 媒介 。 消 息 可 以 是 任意 的 Erlang 数 据 。 进 程 间 的 消息 传递 是 异 
步 的 ， 消 息 接 收 方 总 会 拿 到 消息 的 一 份 单独 的 副本 。 消 息 送 达 后 就 被 存放 在 接收 方 的 信 
箱 内 ， 接 收 方 进程 可 以 通过 receive 表 达 式 来 获取 消息 。 

快速 理 清 了 头绪 ， 接 下 来 便 是 行为 模式 的 概念 。 


.2 行为 模式 基础 


行为 模式 是 面 回 进程 编程 中 各 种 和 见 模式 的 一 种 形式 化 表述 。 比 如 , 服务 带 这 个 概念 就 非 篆 
通用 , 你 所 编写 的 进程 之 中 很 大 一 部 分 部 符合 这 个 概念 。 这 些 进程 有 很 多 共通 之 处 一 一 尤其 是 在 
避 循 OTP 监 督 规范 等 方面 。 每 出 现 一 种 新 的 服务 带 进 程 就 重新 编写 一 过 这 类 代码 是 坚 无 意义 的 ， 
这 样 做 还 会 到 处 引入 各 种 琐碎 的 bug 和 细微 的 差异 。 

相反 ，OTP 行 为 模式 将 这 类 反复 出 现 的 模式 分 成 了 两 个 部 分 : 通用 部 分 和 具体 应 用 相关 的 实 
现 部 分 。 二 者 通过 一 套 简 单 明 确 的 接口 进行 通信 。 比 如 ,在 本 革 , 你 即将 开发 的 模块 也 会 包含 这 
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么 一 个 实现 部 分 , 它 对 应 的 正 是 OTP 中 最 常见 也 最 实用 的 行为 模式 :通用 服务 右 , 妈 gen_server。 

1. 行为 模式 的 组 成 部 分 

在 日 肖 交 流 中 ， 行 为 模式 这 个 词 大 有 人 被 滥用 的 嫌疑 ， 它 可 指 代 下 列 多 个 概念 : 

D 行为 模式 接口 ; 

D 行为 模式 实现 ; 

D 行为 模式 容 剖 。 

行为 模式 的 接口 是 一 组 特定 的 函数 和 相关 的 调用 规范 。gen_servet 行 为 模式 的 接口 包含 六 
> 浮 数 : init/1、 handle call/3、 handle cast/2、handle info/2、terminate/2 和 和 








Code change/3o 

所 谓 实 现 , 指 的 是 由 程序 员 提 供 的 具体 应 用 相关 的 代码 。 行为 模式 的 实现 是 一 个 导出 了 接口 
所 需 的 全 部 函数 的 回调 模块 。 实 现 模块 中 还 应 包含 一 项 属性 -behaviour(...)， 用 以 说 明 该 模 
块 所 实现 的 行为 模式 的 名 称 , 这 样 编 详 尖 便 可 以 协助 检查 模块 是 否 完 整地 导出 了 接口 所 需 的 所 有 
函数 。 代 码 清单 3-1 列 出 了 模块 的 首部 以 及 实现 gen_server 所 必需 的 接口 函数 。 


代码 清单 3-1 gen_servet 行 为 模式 最 精简 的 实现 模块 


-modulel(...}). 








-behaviour (gen server). 





-export([init/1, handle call/3, hangdle cast/2, hangdle info/2, 
terminate/2, code_ change/31). 


-recordlstate, {})}). 


init{[]}) -> 
{ok, #statef{}}. 


handle call: Regquest, _From, State) -> 
Reply = ok, 
{reply, Reply, State}. 


handle cast( Msg, State) -> 
{noreply, State}. 


handle_info!{_ Info， State) -> 
{noreply, State}. 


terminate!{( Reason, _State}) 一 > 
Ok. 


code change!{t OlgdVvesn, State, Extra) 一 > 
{ok, State}. 


如 有 果 人 遗 汤 了 其 中 的 茶 些 函数 ,该 行为 模式 实现 就 无 法 完全 满足 gen_server 接 口 的 要 求 ， 这 
种 情况 下 编译 带 会 给 出 警告 。 等 到 下 一 节 你 开始 换个 儿 实 现 这 些 郴 数 去 创建 你 的 RPC 服 务 融 的 时 
候 ， 我 们 再 逐一 解释 每 个 困 数 的 作用 。 

行为 模式 的 第 三 个 也 是 最 后 一 个 部 分 就 是 容器 。 容 天 是 一 个 进程 , 它 执 行 的 是 条 个 库 模 块 中 
的 代码 , 并 且 会 调用 与 行为 模式 实现 相对 应 的 回调 模块 来 处 理应 用 相关 的 逻辑 。( 从 技术 角度 说 ， 
容 带 也 可 以 由 多 个 密切 相关 的 进程 构成 ,但 通 第 只 有 一 个 进程 。) 该 库 模 块 的 名 称 与 对 应 的 行 ， 
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模式 的 名 称 一 致 。 亩 模块 中 包 合 行 为 模式 中 的 通用 代码 ， 其 中 也 包括 新 容 各 的 局 劲 阴 数 。 例 如 ， 
对 于 gen_servez 行 为 模式 而 言 ， 这 部 分 代码 就 位 于 Erlang/OTP 库 中 stdqlib 部 分 的 gen server 模 
块 中 。 当 你 下 调用 gen_ Server:startl. ,foo,，. . . ) 时 ， 就 会 创建 一 个 新 的 以 foo 为 回调 模块 
的 gen_servez 容 上 需 。 

在 开发 标准 、 并 发 、 容 错 的 OTP 代 码 时 ， 大 部 分 的 复 末 性 都 可 以 徘 行为 模式 容 人 来 消解 。 库 
代码 可 以 处 理 同步 消息 、 进 程 初始 化 ， 以 及 进程 清理 与 终止 等 事务 ,还 提供 了 一 系列 挂 接 点 ， 以 
便 将 模块 融入 代码 变更 框架 * 和 监督 树 等 更 大 的 OTP 模 式 和 结构 。 














容器 这 个 词 是 我 们 自己 选用 的 术语 ， 不 过 我 们 党 得 挺 合适 的 。OTP 文档 倾向 于 只 谈论 进 
程 ， 而 不 去 区 分 不 同 进程 在 行为 模式 中 的 职责 ， 有 时 候 会 显得 不 清 不 楚 。( 如 果 你 了 解 Java 中 
的 JEE 容器 ,就 会 发 现 其 中 有 很 多 相似 之 处 ,但 也 有 一 些 区 别 :OTP 容器 很 轻 量 ,而且 在 Erlang 
行为 模式 中 容器 是 唯一 的 实体 。) 


2. 行为 模式 的 实例 化 

行为 模式 的 目的 在 于 为 特定 类 型 的 进程 提供 一 套 模板 。 每 个 行为 模式 库 中 的 模块 部 有 一 个 或 

个 用 于 局 动 新 的 容 需 进程 的 API 困 数 (通常 名 为 start 和 /或 start_link )。 我 们 将 新 容 需 进程 
的 启动 称 作 和 J 为 模式 的 实例 化 。 





进程 类 型 是 一 个 通俗 的 说 法 (无 论 是 否 涉 及 行为 模式 ), 我 们 用 它 来 指 代 诸 如 gen_server 
等 同类 进程 。 进程 如 果 执 行 着 大 致 相同 的 代码 ， 就 可 以 被 归 为 同一 类 型 ， 换言之 它们 所 能 理解 
的 消息 种 类 也 大 臻 相同。 对 于 同一 类 型 的 两 个 进程 而 言 ， 它 们 之 间 唯 一 的 区 别 就 在 于 各 自 的 状 
态 。 同 类 型 的 进程 通常 也 有 着 相同 的 派生 签名 (或 初始 调用 )， 也 就 是 说 ， 它 们 具有 相同 的 入 


口 削 数 。 


< 





菏 些 情 况 下 ,你 会 希望 某 个 行为 模式 的 实现 模块 在 同一 时 间 仅 有 一 个 实例 ; 其 他 情况 下 , 你 
会 希望 创建 出 成 二 上 万 个 跑 着 相同 的 代码 却 携 之 着 不 同 数据 的 进程 。 重要 的 是 , 你 得 记 住 你 的 
回调 代码 是 在 容 表 中 执行 的 ， 而 容 带 又 是 一 个 具有 目 己 的 吴 份 和 状态 《包括 信箱 ) 的 进程 。 这 很 
像 面 品 对 象 编 程 中 的 对 象 ， 只 不 过 容 带 是 并 行 存活 着 的 代码 执行 者 。 

总 结 下 来 ， 行 为 模式 接口 就 是 让 行为 醒 式 实现 〈 你 编写 的 代码 ) 发 挥 出 行为 模式 容 休 能 力 的 站 
约 。 其 目的 在 于 简化 休 循 特定 并 发 编程 模式 的 进程 的 实现 。 使 用 OTP 行 为 模式 可 以 市 来 一 系列 好 人 处: 

口 开发 者 得 以 用 更 少 的 代码 完成 更 多 的 事情 一 一 有 时 可 以 大 大 缩减 代码 量 ; 

口 代码 坚 如 卷 石 、 稳 定 可 乱 ， 因 为 其 核心 库 代 码 经 过 了 严酷 的 测试 ; 

口 代码 可 以 被 瞳 入 更 大 、 提 供 更 强劲 功能 的 OTP 框 架 ， 例 如 监督 树 ; 





















































OD 代码 变更 框架 用 于 处 理 代码 热 部 置 ， 即 在 不 停止 服务 的 情况 下 升级 或 降级 服务 代码 ， 本 书 未 详细 讨论 该 主题 。 
一 一 译 者 注 
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口 代码 更 易于 理解 ， 因 为 仁 循 的 是 众所周知 的 模式 。 

对 行为 模式 有 了 基本 的 了 解 之 后 ,我们 就 要 开始 在 上 述 内 容 的 基础 上 实现 RPC 服 务 闹 了 。 从 
现在 开始 你 所 做 的 所 有 工作 都 与 TCP RPC 服 务 益 的 实现 有 关 ， 这 个 练习 涉及 的 东西 很 多 。 在 菏 一 
层面 上 看 ， 它 讲述 的 是 如 何 运 用 行为 模式 。 你 将 开发 出 一 套 符合 行为 模式 接口 的 行为 模式 实现 ， 
还 会 看 到 gen_server 行 为 模式 如 何 为 你 提供 所 需 的 各 种 功能 。 然 而 从 为 一 层面 上 看 ， 你 在 本 间 
所 做 的 事情 还 很 基础 : 不 过 才刚 刚 开 始 在 Erlang 中 使 用 OTP 框 总 罢了 。 
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对 于 中 等 水 准 的 Erlang 程 序 员 而 言 ， 和 模块、 进程、 本 数 以 及 消息 传递 等 概念 午 不 阳 生 。 但 他 
们 的 经 验 多 半 源 目 一 些 非 正 式 的 简单 Erlang 应 用 环境 。 在 本 章 ， 我 们 将 在 OTP 环 境 下 重新 审视 这 
些 概念 。 如 果 你 还 是 个 打算 用 本 书 来 人 门 的 Erlang 新 手 ， 那 么 你 很 可 能 已 经 是 一 名 有 着 不 同 的 技 
术 育 景 的 程序 员 老 手 。 这 样 的 话 ， 无 须 补 充任 何 预备 知识 你 也 能 看 得 疏 本 章 的 内 容 。 

依 我 们 之 见 ， 在 不 使 用 OTP 的 情况 下 直接 用 进程 和 消息 传递 编写 纯 Erlang 代 码 〈 且 做 到 万 无 
一 失 ) 反而 是 更 为 高 级 的 话题 ， 只 是 万 不 得 已 而 为 之 的 下 策 。 没 有 纯 Erlang 开 发 的 经 验 或 许 也 算 
是 种 福气 , 这 样 一 来 你 便 可 以 下 接 进 入 正规 OTP 开 发 方式 的 学 习 一 一 其 至 还 包括 一 系列 更 为 严格 
的 编程 规范 ， 我 们 用 这 些 规范 来 对 模块 的 结构 和 布局 、 内 联 文档 以 及 注释 等 方面 进行 约束 。 

鉴于 你 即将 开发 的 行为 模式 实现 必须 以 模块 为 载体 ， 我 们 先 从 模块 的 创建 和 布局 讲 起 。 


3.2.1 行为 模式 实现 模块 的 典型 布局 


行为 模式 的 一 大 优点 就 在 于 它们 的 高 度 一 致 性 。 查 看 行为 醒 式 实现 醒 块 时 ,你 一 眼 就 能 识别 
出 这 类 模块 中 诸如 行为 模式 接口 函数 这 样 的 公共 部 分 ， 以 及 start 或 start_1ink 卫 数 等 目 定 义 
的 部 分 。 采 用 下 述 的 行为 模式 实现 模块 的 典型 布局 还 可 以 进一步 增加 这 些 文件 的 可 辨识 性 。 

这 份 标准 布局 可 分 为 4 段 。 按 照 在 源 但 文件 中 出 现 的 顺序 ， 表 3-1 分 别 列 出 了 这 些 段 洛 的 详情 : 


表 3-1 标准 行为 模式 实现 模块 中 的 源码 段 洛 






























































段 洛 摘 述 有 无 导出 函数 EDoc 标 注 
首部 模块 属性 和 样板 内 容 N/A 有 ， 文 件 级 别 
API 编程 接口 ， 描 述 外界 如 何 与 模块 交互 有 有 ， 国 数 级 别 
行为 模式 接口 行为 模式 接口 所 需 的 回调 函数 有 可 选 
内 部 函数 API 和 行为 模式 接口 函数 的 辅助 函数 无 可 选 


我 们 将 从 模块 首部 开始 ， 依 次 考察 这 些 段落 的 实现 细节 。 
3.2.2 ”模块 首部 


在 创建 模块 的 首部 之 前 ， 你 得 先 建立 一 个 用 于 容纳 它 的 文件 。 既 然 是 在 开发 基于 TCP 的 RPC 
服务 器 ， 不 妨 将 源 文件 命名 为 tr_servererl。 打 开 你 最 爱 的 编辑 硕 ， 开 工 吧 。 
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模块 命名 规范 和 扁平 的 命名 空间 

Erlang 模块 的 命名 空间 是 扁平 的 。 换 言 之 模块 名 可 能 会 冲突 。( Erlang 也 有 一 套 类 似 于 Java 
的 实验 性 的 软件 包 系 统 ， 但 尚未 广泛 使 用 ， 功 能 支持 也 还 不 完整 。) 如 果 都 用 server 之 类 的 名 
字 给 模块 命名 ， 就 很 可 能 会 导致 不 同 工 程 中 的 模块 重 名 。 为 了 避免 这 类 冲突 ， 标准 的 做 法 是 给 
模块 名 加 上 一 个 恰当 的 前 经。 此 处 我 们 用 的 是 TCP 和 RPC 两 个 缩写 的 首 字 母 ， 因 此 是 : 


tr server。 





第 一 件 事 是 录入 位 于 文件 首部 的 文件 级 注释 : 





%%S% @author Martin & Eric <erlware-devQ@googlegroups .com> 

名和 千 [http:/ /www.erlware.orgl 

%S%S%S Qcopyright 2008-2010 Erljware 

%%S% @doc RPC over TCP server. This modGdule defines a server process that 
各 各 包 lijstens for incoming TCP connections and allows the user to 

笔 客 特 execute RPC commands via that TCP Stream . 


注意 , 虽然 注释 用 一 个 % 就 够 了 ,但 这 里 的 每 行 注释 都 以 3 个 % 开 头 。 这 是 文件 级 注释 的 规范 ， 
这 些 注释 描述 的 是 关于 整个 文件 的 信息 。 夯 外 ,这 可 能 也 是 你 头 一 回 见 到 注释 中 包括 EDoc 标 注 。 
EDoc 可 以 直接 通过 源码 标注 生成 文档 ( 与 Javadoc 类 似 )， 是 随 标准 Erlang/OTP 发 行 版 一 同 发 布 的 
文档 生成 工具 。 限于 篇 幅 , 本 书 不 打算 深入 讨论 EDoc 的 使 用 : 详情 参见 OTP 文 档 中 有 关 工 具 的 章 
方 。 在 此 我 们 稍微 多 说 两 句 ， 毕 苋 它 是 Erlang 源 人 码 内 联 文档 的 事实 标准 。 我 们 建议 你 玩 转 EDoc， 
并 把 它 用 到 你 目 己 的 代码 里 。 

EDoc 标 签 都 以 e 字 符 开 头 。 表 3-2 措 述 了 上 述 文件 衣 部 中 出 现 的 各 个 标签 。 等 到 第 4 草 ， 解 释 
完 OTP 应 用 的 工作 原理 之 后 ， 我 们 还 会 继续 讨论 这 个 话题 ， 届 时 我 们 会 侧 要 介绍 如 何 运 行 EDoc 
生成 文档 。 


























表 3-2 ”基本 EDoc 标 签 





标 签 描 述 
Gauthor 作者 信息 和 邮箱 地 址 
@copyright 日 期 和 版 权 归 属 
edoc 常规 文档 文本 。 第 一 句 是 概要 描述 ， 其 中 可 以 包含 XHTML 和 一 些 wiki 
标记 
Qend 标志 着 上 述 任意 一 种 标签 的 完结 。 此 处 可 以 防止 $%%----.. .这 一 行 被 


误 识 别 为 前 面 的 @doc 标 签 的 内 容 








除去 注释 ， 文 件 中 的 第 一 项 就 是 -module(...) 属 性 。 此 处 的 名 称 必须 与 文件 名 对 应 ， 在 这 
星 宙 是 
-moaqulel(tr server). 


(请 记 住所 有 的 属性 和 函数 定义 都 必须 以 句号 结尾 。) 标 跟 在 模块 属性 后 面 的 就 是 行为 模式 属性 。 
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它 告知 编译 器 这 个 神 块 是 某 行为 模式 的 一 个 实现 , 如 果 你 忘 了 实现 并 导出 行为 模式 的 某 个 接口 函 

数 , 编译 器 便 会 给 出 警告 。 你 所 要 实现 的 是 一 个 通用 服务 器 , 所 以 应 该 添加 如 下 的 行为 模式 属性 : 
-behaviour (gen server). 
接 下 来 是 导出 声明 。 通常 要 写 两 个 (编译 器 会 将 它们 合 而 为 一 , 分 开 来 是 为 了 提高 可 读 性 )。 

第 一 个 是 你 自己 的 API， 第 二 个 是 行为 模式 接口 要 求 导出 的 函数 。 由 于 你 的 API 还 没 设计 出 来 ， 

放 一 个 空 的 导出 声明 占 位 即 可 。 但 行为 模式 的 接口 函数 都 是 已 知 的 ， 罗 列 如 下 : 3 


笔 笔 API 
-exPort( []) . 




















SS gen server callbacks 
-export([init/1, handle call/3, handle cast/2, handle info/2, 
terminate/2, code change/31}. 


注意 第 二 个 声明 上 方 的 注释 。 行 为 模式 的 接口 函数 常 被 称 作 回调 (callback )。 这 是 因为 容 需 
启动 时 , 行为 模式 实现 模块 的 模块 名 会 被 传 给 新 建 的 容器 ,而 容器 随后 又 会 通过 接口 函数 反问 调 
用 实现 模块 。 我 们 将 在 本 童 逐 一 解释 每 个 接口 图 数 的 用 途 。 

紧 随 导 出 声明 之 后 的 是 一 系列 可 选 的 应 用 相关 的 声明 和 /或 预 处 理 定义 。 代 码 清 单 3-2 完 整地 
展示 了 tr_server 模 块 的 首部 ， 并 突出 显示 了 这 些 声 明和 定义 。 


代码 清单 3-2 tr server.erl 的 完整 首部 

















SS Qauthor Martin & Eric <erlware-devQAgooglegroups .com> 

竺 省 告 [http:/ /www.erlware.orgl 

SS%S Qcopyright 2008 Erlware 

SS%S QQdoc RPC over TCP server. This module defines a server process that 
特 笔 饮 listens for incoming TCP connections and allows the user to 

宪 宪 笔 execute 有 PC commands via that TCP stream. 

守 针 千 Qend 








-module (tr server}). 


-behaviour{(gen_ server). 





竺 千 API 

-export!{l| 
start link/1, 
start link/o, 
get_count/o, 
stop/0 
] ). 


SS gen server callbacks 
-export([init/1l, handle call/3, handle cast/2, .handle info/2, 将 SERVER 设 置 为 
terminate/2, code change/3]). ] 





模块 名 
-define (SERVER, ?MODULE). < 
-define (DEFAULT_PORT, 1055). < 天 定义 默认 端口 
-record{(state, {port, lsock, request count = 0}). -© 用 于 保存 进程 状态 
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宏和 被 用 于 定义 稼 量 ， 这 样 一 来 要 修改 常量 时 只 震 修 改 一 处 代码 即 可 《〈 参 见 2.12 节 )。 此 处 
用 宏 定 义 了 默认 端口 个 ， 并 将 SERVER 定义 成 了 模块 名 @@〈 服 务 器 名 后 续 还 可 能 会 修改 ， 因 此 不 
要 认为 服务 做 名 总 是 与 模块 名 保持 一 致 ) 定义 完 安 ， 你 还 定义 了 一 个 记录 ， 指 定 了 该 记录 的 儿 
字 和 格式 〈 人 参见 2.11 )， 这 个 记录 将 被 用 于 保存 服务 带 进 程 的 运行 时 状态 合 。 

首部 已 经 介绍 完了 了， 我 们 来 看 一 下 行为 模式 实现 模块 的 下 一 个 段落 : API。 





3.2.3 API 段 


模块 的 所 有 功能 都 是 通过 应 用 编程 接口 (API ) 提供 给 用 户 的 ( 用 户 才 不 会 关心 你 的 实现 细 
市 )。 对 于 通用 服务 器 而 言 ， 用 户主 要 完成 以 下 两 件 事 : 

口 启动 服务 磊 进 程 ; 

口 癌 进 程 发 消息 ( 并 获取 应 答 )。 

gen_server 提 供 了 3 个 主要 的 库 浮 数 来 实现 这 些 基 本 功能 。 如 表 3-3 所 示 。 


表 3-3 gen_servezr 实 现 API 的 库 函 数 














库 函 数 对 应 的 回调 函数 描 述 
gen_ server:start link/4 Module:init/1 启动 并 链接 一 个 gen_server 容 器 进程 
gen_server:call/2 Module:handle call/3 问 gen server 进 程 发 送 同 步 消 息 并 等 待 应 答 
gen _ server:cast/2 Module:handle cast/2 向 gen server 进 程 发 送 异 步 消息 











基本 上 ，API 搬 数 只 对 这 些 库 水 数 做 了 一 些 简单 包 滩 ， 以 便 在 用 户 面 前 屏蔽 实现 细 市 。 展 现 
这 些 图 数 的 工作 机 理 的 最 佳 手段 ， 就 是 用 它们 来 实现 tr_server 模 块 的 API， 如 代码 清单 3-3 所 示 。 


代码 清单 3-3 tr server.erl 的 API 段 

















竺 竺 千 API < 二 一 
告 洛 @doc Starts the server. 段落 起 始 处 的 标题 
SS @spec start link (Port::integer(}) -> {ok, Pid} 


竺 客 where 


start link{Port) -> 
gen server:start link({local, ?SERVER}, ?MODULE, [Port], [])}). 


%% @spec start link() -> {ok, Pid)} 
%% @doc Calls start link(Port)' using the default port. 派生 服务 器 进程 
start_link{) -> , | 


start_link{?DEFAULT_ PORT). 


doc Fetches the number of requests made to this server. 
spec get_count() -> {ok, Count} 


oo 
op 
(DD 
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%% Count = jinteger{) 





get_count{(} 一 > 
gen server:call (?SERVER, get count). -© 调用 方 会 等 待 应 答 








doc Stops the server. 
spec stop() -> ok 


oo 
Go 
{DD 


stop(}) 一 > 
gen_server:cast (?SERVER, stop). <- 无 须 坐 等 应 答 


请 求 @ 使 用 的 是 gen_server:call/2，, 发 送 请 求 后 调用 方 必须 坐等 应 答 。 而 stop 人 @ 这 类 简 
单 命令 通常 会 选用 异步 的 gen_server :cast/2 来 实现 。 











一 个 模块 一 种 进程 

尽管 我 们 可 以 同时 从 单个 模块 中 派生 出 多 个 进程 ,但 应 该 保证 每 个 模块 中 的 代码 仅 涉 及 一 
种 类 型 的 进程 ( 由 客户 端 执行 的 API 代 码 除 外 ， 客 户 端 可 能 是 任意 类 型 的 进程 )。 如 果 模 块 的 
各 个 部 分 分 别 由 不 同类 型 的 进程 来 执行 , 模块 在 系统 中 的 角色 便 会 不 清晰 , 从 而 导致 模块 本 身 
和 整个 系统 变 得 难以 理解 。 


从 代码 清单 3-3 列 出 的 API 中 你 可 以 大 致 看 出 tr_server 所 能 做 的 3 件 事 : 

口 用 start link() 或 start link (Port) 启 动 服务 闫 : 

口 用 get_count () 查询 服务 融 已 处 理 的 请 求 数 ; 

口 调用 stop () 终 止 服务 天 。 

在 深入 探讨 这 些 冰 数 的 运作 方式 ， 以 及 调用 者 和 服务 需 进 程 〈 容 器 ) 之 间 的 通信 细 方 之 前 ， 
我 们 先 来 复习 一 下 Erlang 的 消息 机 制 。 

1. 进程 和 通信 的 简要 回顾 

进程 是 所 有 并 发 程序 的 基石 。 它 们 通过 投递 异步 消息 相互 通信 , 消息 抵达 之 后 便 被 放 和 人 接收 
进程 的 信箱 中 排队 等 候 处 理 。 图 3-3 展 示 了 消息 进入 信箱 的 过 程 ， 在 接收 进程 前 来 分 拣 消 息 之 前 ， 
消息 会 被 一 百 存放 在 这 儿 。 

进程 的 这 种 目 动 缓存 外 来 消息 ， 并 根据 当前 情况 对 消息 进行 选择 性 处 理 的 能 力 是 Erlang 的 一 
个 关键 特性 (有关 选 择 性 接收 的 详情 请 参见 2.13.2 市 )。 

理解 了 上 述 原理 , 现在 我 们 来 看 看 OTP 库 是 如 何 化 解 客 户 曾 与 服务 春之 间 消 居 传 递 的 大 量 珊 
人 雄 细 广 ， 从 而 给 你 提供 出 一 整套 更 高 层 的 进程 通信 工具 的 。 也 许 在 灵活 性 上 这 些 工 具 无 法 与 你 
自行 打造 的 通信 模式 相提并论 , 但 它们 简单 、 可 靠 ， 并 且 足 以 应 对 大 部 分 的 日 常 需求 。 同 时 它们 
还 在 超时 、 监 督 ， 以 及 错误 处 理 等 方面 提供 了 保障 。 即 便 不 使 用 OTP 库 ， 你 也 必须 自行 解决 这 些 
方面 的 问题 ( 尽 是 些 既 枯燥 又 庞杂 ， 还 很 难 确保 万 无 一 失 的 工作 )。 
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新 消息 











图 3-3 ”消息 抵达 目的 地 之 后 ， 除 非 进 程 主动 将 消息 取 走 ， 否 则 消息 会 一 直 集 留 在 进程 
的 信箱 内 。 信 箱 的 大 小 是 没有 上 限 的 


2. 屏 散 协议 

我 们 将 进程 所 能 接受 的 消息 的 集合 称 作 该 进程 的 协议 。 然 而 消息 的 这 些 细节 是 不 应 该 骏 露 给 
用 户 的 ， 因 此 API 的 主要 职责 之 一 就 是 对 外 界 屏 向 协议 。 

你 的 tr_server 进 程 可 以 接受 下 列 简 单 消息 : 

[oet Count 














UD stop。 
虽然 二 者 都 只 是 简单 的 原子 ， 但 tr_server 模 块 的 用 户 却 没有 必要 了 解 这 些 实现 细 方 ， 这 些 都 应 
该 屏蔽 在 API 函 数 身 后 。 不 妨 假想 一 个 未 来 将 会 加 入 你 的 服务 需 的 扩展 功能 ， 该 功能 要 求 用 户 必 须 
先 登 录 才 能 发 送 请 求 。 于 是 你 的 API 束 得 增加 一 个 用 于 在 服务 需 端 创建 用 户 的 函数 ， 如 下 所 未 : 
addq_USser (Name，PasSsword，Petrrmissions) -> 
den server:call(?SERVER, {add user, [{name, Name}, 


{Passwd, Password}, 
{perms, Permissions}]}). 


这 类 复杂 消息 格式 不 应 该 流 于 模块 之 外 。 如 采 客 户 闯 依赖 于 该 格式 , 日 后 修改 起 来 可 就 难 了 。 
将 与 服务 天 进行 通信 的 逻辑 封 交 于 API 国 数 内 ， 模 块 的 用 户 便 可 无 视 这 些 消 息 的 格式 。 

最 后 ，Erlang 中 的 所 有 消息 在 底层 都 是 异步 发 送 的 《通过 ! 运 算 符 )， 实 际 应 用 中 ， 发 送 方 在 
收 到 期 望 的 应 答 之 前 其 实 什 么 也 做 不 了 。gen_server:cal1/2 困 数 实现 了 可 敌 的 同步 请 求 - 啊 
应 功能 ， 其 中 默认 应 答 等 待 超时 为 5 秒 ， 一 旦 超时 便 放 弃 等 竺 应答 (另外 一 个 版 本 
gen_servezr:cal1/3 人 允许 以 毫秒 为 单位 设置 超时 ， 同 时 也 可 以 通过 将 超时 设置 为 infinity 来 
禁用 超时 )。 


双重 屏蔽 

此 处 还 有 一 层 屏 蔽 : OTP 库 向 你 屏蔽 了 实际 往返 于 进程 之 间 的 消息 的 细节 。 实 际 上 你 传 
给 call/2 和 cast/2 的 消息 数据 参数 仅仅 是 实际 消息 的 载荷 。 其 外 国 还 会 自动 包 上 一 层 元 数 
据 , 用 于 辅助 gen_server 容器 区 分 消息 类 型 (这 样 容器 才 知 道 该 用 哪个 回调 处 理 消息 载荷 )， 
从 而 将 应 答 回 传 给 正确 的 进程 。 
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现在 ， 我 们 已 经 清楚 地 解释 了 API 函 数 的 目的 以 及 用 于 实现 它们 的 gen_server 库 果 数 ， 该 
回 过 神 来 看 看 代码 了 。 

3. 深入 API 函 数 

代码 清单 3-3 列 出 了 各 API 的 实现 代码 ， 现 在 我 们 来 详细 解释 它们 的 作用 。 首 先 ， 表 3-4 总 结 
了 这 4 个 API 函 数 。 





单 例 进程 
简单 起 见 ， 我 们 将 这 个 服务 器 设计 成 了 单 例 : 同一 时 刻 你 只 能 运行 该 服务 的 一 个 实例 。 

动 后 , 新 的 gen_server 容器 进程 将 以 代码 清单 3-2 中 定义 的 SERVER 宏 为 名 进行 注册 ( ee 
清单 3-3 中 的 {local，?SERVER} 参 数 的 作用 便 在 此 )。 这 样 一 来 get_count () 和 stop() 才 

能 够 通过 进程 名 与 服务 器 通信 。 如果 要 同时 启动 多 个 服务 器 实例 ,还 要 对 程序 稍 作 修改 ， 因 为 
进程 的 注册 名 是 不 能 重复 的 (参见 2.13.3 节 进 程 注册 表 相 关 的 内 容 )。 不 过 ， 单 例 服务 也 是 一 
种 常用 的 建立 系统 级 服务 的 手法 ， 这 些 服务 在 每 个 Erlang 节点 上 只 能 有 一 个 实例 (甚至 整个 
Erlang 集群 中 也 只 能 有 一 个 实例 )。 因 此 ， 单 例 服 务 器 器 并 不 是 那么 不 切实 际 的 例子 。 


表 3-4 tr server API 


名 数 描 述 
start limky/1 启动 tr_server 并 监听 指定 端口 
start link/0 同 start_link/1, 但 使 用 默认 妆 口 
SEE coumty/d 返回 目前 为 止 处 理 完 成 的 请 求 数 
stop/0 关闭 服务 帮 


这 批 API 也 数 的 工作 机 制 如 下 。 

DD start link (Port) ) 和 start link() 一 一 启动 并 链接 服务 右 进 程 。 这 这 是 通 过 过 调用 gen_ 
server:start_link/4 实 现 的 ,行为 模式 容器 也 正 是 通过 该 调用 得 知行 为 模式 实现 位 于 
哪个 回调 模块 中 的 ( 见 第 二 个 参数 ), 一 般 只 需 传 人 内 置 宏 MoDULE 的 值 即 可 , 该 安 展开 后 
是 当前 的 模块 名 《参见 2.12.1 )。 
gen server:start link({local, ?SERVER}, ?MODULE, [Port], [] 
执行 这 个 调用 时 ， 会 派生 出 一 个 新 的 gen_server 容 器 进程 ， 新 进程 将 以 SERVER 宏 展开 
后 对 应 的 名 称 在 本 地 世 点 上 注册 ， 然 后 等 竺 行为 模式 实现 模块 中 的 init/1 回 调 函 数 完 成 
进程 初始 化 ， 最 后 返回 ( 更 多 相关 内 容 参 见 3.2.4 节 )。 至 此 ， 服 务 右 启动 完毕 并 完成 了 所 
有 初始 化 工作 ， 已 经 准备 好 接受 消息 了 。 

第 三 个 参数 ， 即 此 处 的 [Port] 为 服务 党 提 从 了 启动 用 的 初始 数据 。 该 参数 会 被 传 给 
ER 1 回调 函数 ， 用 于 设置 进 程 初始 枯 太 。 第 四 个 参数 是 附加 参数 列表 ， 此 处 留 空 即 可 。 

意 ， 从 API 用 户 的 角度 来 看 ,这些 细 市 全 都 被 屏蔽 了 ， 用户 只 须 关 心 一 个 参数 即 服 务 顺 
ee 
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get _ count() 一 一 用 gen server:call/2 回 服 务 需 同步 发 送 原子 get_count 区 也 就 是 
说 该 调用 会 等 每 服务 如 应 答 ， 从 而 临时 挂 起 调用 进程 : 
gen server:call(?SERVER, get_ count) 
调用 中 的 第 一 个 参数 必须 是 服务 天 进程 的 注册 名 或 进程 ID ， 此 处 用 的 是 start_1Link/1I 
驮 数 中 注册 进程 时 所 用 的 名 称 ( SERVER 宏 )。 调 用 中 的 第 二 个 参数 是 要 发 送 的 消息 。 服 务 
售 收 到 消 息 并 处 理 完毕 后 ， 会 将 应 答 回 传 给 发 起 请 求 的 进程 。 gen SerVer :cal17/2 吨 数 
会 负责 接收 应 答 并 将 之 作为 函数 调用 的 结 采 返回 ， 因 此 调用 方 完全 不 用 关心 消息 收发 。 
可 以 看 到 消息 中 的 原子 get_count(〈 服 务 硕 协议 的 一 部 分 ) 与 相应 的 API 函 数 同名 。 这 样 
做 有 助 于 代码 的 阅 谈 和 调试 一 一 千 万 不 要 随心 所 和 欲 地 把 服务 硕 内 部 协议 和 弄 得 轮 深 不 堪 。 




















口 stop () 一 一 用 gen_server:cast/2 异 步 发 送 原子 stop (也 就 是 说 函数 可 以 立即 返回 ， 
无 须 等 符 应 答 ): 


gen SerVetr :Cast ( ?SERVER ， stop) 
消息 发 送 完毕 后 ， 你 可 以 认为 服务 融 一 收 到 消息 便 会 目 行 天 财 。 此 处 无 须 应 答 ， 所 以 选 
用 cast 而 非 cal11。 
对 于 这 个 简单 服务 甫 而 言 ， 这 些 冰 数 就 够 了 。 毕 竞 大 部 分 功能 都 是 经 由 TCP 连 接 完 成 的 ， 
这 几 个 API 函 数 仅 用 于 服务 局 停 和 状态 检查 。 
4. espec 标 签 
在 定义 行为 模式 的 接口 回调 函数 之 前 ， 我 们 打算 先 简 要 介绍 一 下 位 于 各 因数 上 方 文档 中 的 
EDoc 标 签 ( 见 代 码 清单 3-3 ) 强 烈 建议 你 给 每 个 API 果 数 及 整个 模块 都 至 少 加 上 一 个 edaoc 标 注 ( 见 
代码 清单 3-2 )。 附 加 的 @spec 标 签 可 用 于 描述 函数 输入 参数 的 类 型 和 返回 值 的 类 型 。 例 如 ， 
start link/1 的 espec 


全 -总 


% @spec start link(Port::integer(}} -> {ok, Pigd} 
各 where 
和 Pid = pidt{) 


说 明 该 函数 可 以 接受 一 个 整 型 参数 并 返回 元 组 {ok，Pid}， 其 中 Pigd 是 一 个 进程 标识 符 。 类 型 名 
总 是 形 如 函数 调用 ， 因 此 不 会 与 原子 相 混 消 ， 比 如 integer () 。 你 可 以 以 : :为 分 隔 符 将 类 型 百 
接 标 注 在 Port 等 变量 之 后 ， 也 可 以 以 where Piq = ... 的 形式 将 类 型 列 在 规格 说 明 的 末尾 。 

用 户 API 部 分 就 此 告 一 段落 ， 终 于 要 开始 实现 行为 模式 的 接口 函数 了 一 一 大 部 分 实际 功能 都 
是 由 这 些 回调 函数 完成 的 。 


3.2.4 回调 函数 段 


你 在 API 中 用 到 的 每 个 gen_server 库 函数 都 有 一 个 gen_server 行 为 模式 接口 指定 的 回调 
为 数 与 之 对 应 。 现 在 该 实现 这 些 回 调 了 。 为 了 回 兢 相 关内 容 ， 表 3-5$ 复 述 了 表 3-3， 但 额外 加 上 了 
handle_info/2，API 中 用 到 的 各 个 库 函 数 无 一 与 之 对 应 。 

首先 回顾 一 下 代码 清单 3-3 中 的 tr server:start link/ 1 子 数 ， 该 函数 对 用 户 屏 菩 J gen_ 
server:start_link/4 调 用 ; 由 表 3-5 可 以 看 出 ， 新 容 兹 进程 随后 会 回调 tr_server:init/1 

















op od 


op 
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(根据 gen_server 行 为 模式 接口 的 约定 ，tr_server 模 块 必须 导出 该 函数 ) 来 执行 初始 化 操作 。 与 
此 类 似 ，tr_server:get _count/0 对 用 户 屏 项 了 通信 协议 以 及 gen_ ng 
信和 细节。 容器 收 到 消息 后 , 将 回调 tr_server:handle_call/2 来 处 理 消息 。 在 这 个 例子 中 ， 
类 消息 只 可 能 有 原子 get_ count 一 种 。 同样 ， es 
希 异 步 派发 消息 ， 收 到 这 类 消息 后 ， 容 需 会 回调 tr_server:handle_cast/2。 








表 3-5 gen_servezr 的 库 函 数 及 回调 





库 范 数 对 应 的 回调 函数 拉 述 
gen server:start link/4 Module:1init/1 启动 并 链接 一 个 gen_server 容 器 进程 
gen _ server:call/2 Module:handle call/3 向 gen _server 进 程 发 送 同步 消息 并 等 待 应 答 
gen_ server:cast/2 Module:handle cast/2 向 gen server 进 程 发 送 异 步 消息 
N/A Module:handle_info/2 处 理 通过 call 或 cast 函 数 以 外 的 手段 发 送 给 


DY DS 


gen_server 容 器 的 消息 。 这 些 都 是 带 外 
(out-of-band) 消息 


但 请 注意 nandle_info/2 没 有 对 应 的 gen_server 库 函数 ,这 个 回调 是 一 个 重要 的 特例 , 所 
有 未 经 cal11 或 cast 库 因数 发 送 至 gen_ Server 信箱 的 消息 都 由 它 处 理 (通常 是 直接 用 :! 运 算 符 发 送 
et 出 于 多 种 原因 ，gen_server 容 问 的 信箱 中 会 出 现 这 类 消息 一 一 例如 ,回调 代码 有 可 

可 第 三 方 请 求 数 据 。 就 你 的 RPC 服 务 疾 而 言 ， 它 接收 的 TCP 数 据 离 开 僚 接 字 之 后 便 会 被 转换 为 
由 通 消息 发 ee 

讲 完 了 这 些 ， 代 码 清单 3-4 列 出 的 正 是 你 要 实现 的 回调 函数 。 


代码 清单 3-4 ”tr server 的 gen_server 回 调 


2 



































init([Port]) -> 4 务 器 
{ok, LSock} = gen tcp:listen(Port, [{active, true}l]), 
{ok, #state{port = Port, lsock = LS8Sock}, 0}. 

handle call {get count, _From, State} -> 0 
{reply, {ok, Statet#tstate.redquest count}, State}. 

handle cast {stop, State) -> aa 
{stop, normal, State}. 





初始 化 服务 器 时 ，init 函 数 会 创建 一 个 TCP 监 听 套 接 字 , 设置 初始 的 状态 记录 , 还 会 立即 触 
发 一 次 超时 。 然 后 ， 是 用 于 告知 客户 端 进程 当前 已 处 理 请 求 数 的 代码 。 在 最 后 一 个 函数 中 , 返回 
值 stop 比 较 特 殊 ， 用 于 让 gen_server 进 程 退 出 。 

正如 代码 清单 3-4 所 示 ， 且 3 个 回 油 函 数 各 很 重音。 ( 我们 把 handle_ di 
到 后 面 的 代码 清单 3-5 中 讲解 。) 这 3 个 也 数 中 最 复 困 0 它们 的 返回 值 的 格式 了 ， 这 些 返 
回 值 被 用 于 与 gen_servez 容 天 进程 通信 。 符 我 们 来 逐 J 分析。 

口 init/1， 初 始 化 回调 ee ( 比如 通过 gen_server: 
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口 nandle call/3， 同 步 请 求 回调 


口 handle cast/2， 异 步 消 息 回 调 
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start_1link/4 ) 这 个 函数 都 会 被 调用 。 这 是 OTP 协 助 你 以 最 小 代价 编写 工业 强度 代码 的 
第 一 个 范例 。start_link 库 图 数 会 帮 你 完成 相关 设置 ,从 而 使 你 的 代码 能 够 顺利 挂 接 到 
OTP 强 大 的 进程 监督 结构 上 。, 此 外 , 它 还 提供 了 严格 的 进程 初始 化 支持 , 在 进程 完成 局 动 、 
注册 ( 如 采 要 求 注册 的 话 ) 和 init/1 回 调调 用 之 前 ， 它 会 一 二 阻 窒 调 用 进程 ， 从 而 确保 
你 的 进程 在 开始 处 理 请 求 前 完全 准备 就 绪 。 

逐 行 来 看 这 个 函数 ， 首 先 印 和 人 眼帘 的 是 init ([Port])->， 其 含义 是 init 只 接受 一 个 参 
数 ， 该 参数 是 个 仅 含 一 个 元 了 素 的 列表 ， 元素 名 为 Port。 请 注意 这 和 你 在 代码 清单 3-3 中 传 
给 start_link/1L 国 数 的 参数 是 一 样 的 (即便 只 有 一 个 元 素 , 也 请 以 列表 的 形式 传人 , 这 
是 init/1 的 一 个 通用 规范 )。 

接 下 来 ， 用 标准 库 中 的 gen_tcp 模 块 在 指定 的 端口 @ 上 建立 一 个 TCP 监 听 套 接 字 : 

{ok, LSock} = gen tcp:listen{(Port, [{active, true}])}), 

监听 套 接 字 是 用 于 等 待 并 接受 外 来 TCP 连 接 而 建立 的 套 接 字 。 连接 一 旦 建立 , 你 便 会 得 到 
一 个 可 用 于 接收 TCP 报 文 的 主动 套 接 字 。 此 处 用 到 了 {active，true} 选 项 ， 其 作用 在 于 
让 gen_tcp 把 收 到 的 所 有 TCP 数 据 都 以 消息 的 形式 直接 发 送 给 进程 。 

最 后 ，init/1 返 回 一 个 三 元 组 ， 其 中 包含 原 了 于 ok、 初始 进 程 状 态 〈 以 #statef} 记 录 的 
形式 )， 以 及 一 个 莫名 其 妙 的 0: 

{ok, #state{port = Port, lsock = LSock}, 0}. 

这 个 0 表示 超时 值 。 将 超时 置 为 去就 是 让 gen_servet 容 从 在 init/1 结 束 后 立即 触发 一 次 
超时 ,从 而 人 迫使 进程 在 完成 初始 化 之 后 第 一 时 间 处 理 超 时 消息 ( 由 handle_info/2 完 成 )。 
个 中 缘由 我 们 稍 后 再 作 解 释 。 















































每 次 收 到 由 gen_server:call/2 发 送 的 消息 时 这 
个 函数 就 会 被 调用 。 它 接受 3 个 参数 ; 消息 ( 跟 传 给 call 的 一 样 ) From( 暂 晶 不 去 管 它 )， 
以 及 服务 需 的 当前 状态 〈 通 过 init/1 设 置 ， 你 想 设置 成 什么 都 可 以 )。 

此 处 你 只 需 处 理 一 种 同步 消息 : get_count。 你 所 要 做 的 就 是 从 状态 记录 中 提取 出 当前 
的 请 求 数 并 将 之 返回 。 和 上 面 一 样 , 返回 值 是 一 个 三 元 组 @, 但 内 容 与 init/1 稍 有 不 同 : 
{reply, {ok, Statetstate.regquest count}, State}. 

它 告 诉 gen_server 容 从 你 打算 给 调用 方 一 个 应 答 〈 理 应 如 此 ， 协 议 就 是 这 样 设计 的 ); 
回 传 给 调用 方 的 值 应 该 是 元 组 {ok，N}， 其 中 NN 为 当前 的 请 求 数 ; 最 后 服务 融 的 新 状态 应 
与 原状 态 保 持 一 致 《 此 处 未 做 任何 改变 )。 

API 肯 数 stop () 会 使 用 gen_server:cast/2 问 服 
务 关 派发 异步 消息 stop ， 发 送 完 昔 后 无 须 等 竺 任何 应 答 。 你 的 任务 就 是 让 服务 带 在 收 到 
消息 后 目 行 退出 。 通 过 cast 发 送 的 所 有 消息 都 由 tr_server:handle_cast/2 回 调 国 数 
处 理 。 这 跟 handqle call 13 类 似 ， 只 是 此 处 没有 From 人 参数 。 当 handqle_cast 图 数 看 到 
stop 消 息 时 ， 只 须 返 回 下 面 的 三 元 组 即 可 : 


{stop, normal, Statel}. 
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这 会 告诉 gen_server 容 右 该 停 下 来 了 全 〈 即 进程 终止 ), 终止 的 原因 是 normal， 也 就 是 
说 这 是 一 次 正 第 退出 。 当 前 状态 锌 原样 传 回 (虽然 后 续 也 没 机 会 再 用 它 了)。 注 意 随 这 个 
元 组 返回 的 原子 stop 用 于 让 进程 关闭 , 而 API 和 服务 器 之 间 所 使 用 的 协议 中 的 stop 消 息 则 
可 以 换 用 任意 原子 (比如 quit ), 我 们 只 是 选用 了 一 个 跟 API 因 数 stop () 相同 的 名 字 而 已 。 
至 此 , 我 们 已 经 涵盖 了 gen_servez 行 为 模式 相关 的 所 有 重点 内 容 : 接口 、 回 调 图 数 、 容 做， 
以 及 它们 之 间 的 交互 。gen_server 相 关 的 内 容 肯 定 不 止 这 些 ， 这 些 内 容 将 贯穿 全 书 。 至 于 你 在 
此 实现 的 服务 疾 ， 还 和 猎 一 个 问题 没有 讨论 : 读 外 消息 处 理 。 很 多 服务 融 无 顷 处 理 这 类 消息 ,但 在 
这 个 应 用 中 ， 所 有 的 震 力 活 都 是 在 这 儿 完 成 的 。 
1. 带 外 消息 处 理 
我 们 曾经 解释 过 ， 采 用 cal1 或 cast 以 外 的 手段 发 送 给 gen_server 进 程 的 所 有 消息 都 由 
hanaqle_info/2 回 调 困 数 处 理 。 这 些 消息 都 被 归 类 为 带 外 消息 ， 当 你 的 服务 希 需要 与 第 三 方 模 
块 通信 ， 而 第 三 方 模块 又 依赖 于 直接 消息 通信 而 非 OTP 库 调用 ( 比如 套 接 字 或 端口 驱动 ) 时 ,， 它 
就 派 得 上 用 场 了 。 不 过 如 果 可 能 的 话 ， 还 是 应 该 尽量 避免 使 用 带 外 消息 。 
在 init7/1L 国 数 中 ， 你 为 服务 咒 建 立 了 一 个 TCP 监 听 套 接 字 ， 还 从 该 困 数 中 返回 了 一 个 神秘 
的 0 超时 值 ， 从 而 立即 触发 超时 ( 参见 代码 清单 3-4 )。 


gen server 超时 事件 

gen_server 设置 了 超时 之 后 ,一 旦 超时 触发 ， 就 会 产生 一 条 由 原子 timeout 构成 的 带 
外 消息 , 这 条 消息 将 由 handle_info/2 回调 处 理 。 该 机 制 常用 于 处 理 服 务 器 在 超时 时 间 内 未 
收 到 任何 请 求 的 情况 ， 此 时 可 以 用 它 来 唤醒 服务 器 并 执行 一 些 指定 操作 。 





























这 里 有 那么 点 儿 注 用 了 超时 机 制 的 意思 (但 这 也 是 个 众所周知 的 技巧 ) 其 日 的 是 让 init/1 
国 数 尽快 结束 以 免 start_link(...) 挂 起 。 与 此 同时 ， 你 也 能 确保 服务 顺 立 即 跳 到 指定 的 代码 
段 〈 handle info/2 的 timeout 子 名 ) 继续 执行 局 动 过 程 中 更 为 耗 时 的 部 分 在 这 个 例子 中 
是 等 待 你 创建 的 监听 套 接 字 上 的 连接 〈 参 见 代码 清单 3-5 )。 在 这 个 应 用 中 只 有 这 里 会 用 到 超时 ， 
因此 你 可 以 确定 自己 绝 不 会 再 回 到 这 里 。 

回 到 TCP 套 接 字 的 问题 上 来 : 主动 套 接 字 会 以 消息 的 形式 将 收 到 的 所 有 数据 都 转发 给 建立 套 
接 字 的 进程 。( 如 采 是 和 被动 套 接 字 ,你 就 必须 不 断 询 问 还 有 没有 数据 。) 你 所 要 做 的 就 是 处 理 那 些 
被 转发 过 来 的 消息 。 对 于 gen_server 而 言 ,这 些 数据 都 属于 融 外 数据 ,因此 由 handle_info/2 
回调 函数 处 理 ， 如 代码 清单 3-5 所 示 。 























代码 清单 3-5 hanaqle_info/2、terminate/2 和 codqe_change/3 回 调 困 数 


handle intolftcp，gSocket，RawDatal，State)j -> 完成 RPC 请 求 后 
do_rpc(lSocket, RawData), 
RequestCount = Statet#tstate.regquest_ count, 
{noreply, Statetstate{request count = RegquestCount + 1}}; < 十 一 
handile info(timeout, #state{lsock = LSock} = gtate) -> 
{ok, _Sock} = gen tcp:accept (LSock}), 


递增 计数 
{noreply, State}. 
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terminate(_ Reason, _State) -> 这 两 个 函数 必 不 可 少 ， 
ok. 但 当前 我 们 对 它们 不 


code_change! OldVsn, State, _Extra) -> 
{ok, State}. 


正如 分 析 之 前 的 3 个 回调 一 样 ， 让 我 们 来 仔细 看 看 这 个 驮 数 。hanqle_info/2 是 市 外 消息 回 
调 。 这 个 函数 有 两 个 子 句 ， 一 个 处 理 收 到 的 TCP 数 据 ， 另 一 个 处 理 超 时 。 超 时 子 句 很 简单 ， 前 面 
已 经 作 了 解释 ， 这 也 是 服务 需 执 行 完 init/1 函 数 后 所 要 做 的 第 一 件 事 〈 因 为 init/1L 将 服务 需 超 
时 置 为 去 ): 这 实际 上 是 一 种 延迟 的 初始 化 操作 。 这 个 子 句 调用 gen_tcp:accept/1， 在 你 建立 
的 监听 套 接 字 上 等 待 TCP 连 接 (连接 建立 前 服务 融 将 一 直 阻 塞 于 此 )。 连 接 一 旦 建立 ， 超 时 子 句 
便 会 返回 ， 同 时 通知 gen_server 容 需 继 续 执 行 ， 进 程 状态 则 维持 原样 不 变 。( 每 个 数据 包 都 包 
含 作 为 数据 来 源 的 套 接 字 ， 因 此 你 无 须 记 录 accept 返 回 的 套 接 字 人 句柄。) 

最 后 就 是 处 理 TCP 消 奶 的 子 名 了 了， 这 些 消 奶 应 当 与 模式 {tcp，Socket，RawData} 相 匹配 。 
主动 套 接 字 从 TCP 绥 冲 区 中 读 取 数据 后 发 送 给 套 接 字 所 有 者 进程 的 正 是 这 些 消息 。RawData 是 你 
所 关心 的 域 , 其 中 包含 客户 端 发 送 给 你 的 ASCI 文 本 。( 总 算 回 归 到 这 个 程序 的 根本 目的 了 : 处 理 
TCP 上 的 RPC 请 求 ! ) 数 据 处 理 是 由 代码 清单 3-6 中 列 出 的 辅助 函数 qo_rpc/2 内 的 一 大 段 代 码 完 成 
的 。RPC 执 行 完 毕 后 ， 你 只 需 更 新 服务 絮 状 态 中 的 请 求 计数 (有关 记录 中 域 的 更 新 请 参见 2.11.3 
方 ) 并 将 控制 权 交 还 给 gen_servezr 容 硕 即 可 。 

2. 内 部 函数 

本 章 一 路 看 到 这 儿 也 挺 不 容易 的 , 如 果 你 对 ao_rpcy7/2 函 数 的 实现 不 感 兴趣 , 我 们 也 不 怪 你 。 
你 可 以 直接 跳 到 3.3 节 《不 过 还 是 要 先 录 入 代码 清单 3-6 中 的 代码 ) 去 看 看 如 何 运 行 这 个 服务 需 以 
及 如 何 跟 它 进行 TCP 通 信 。 但 如 采 你 想 了 解 如 何 处 理 输入 、 解 析 和 执行 元 调用 ( meta-call ), 就 请 
接着 往 下 看 吧 。 


代码 清单 3-6 ”内 部 函数 


人 
宇 各 二 



























































SS Internal functions 





00 = >= = 


do_rpc (Socket, RawData) -> 
trYy 


{M, F, A} = split out mfa (RawData), 了 
Result = apply(M, F, A), 
yen tepreendlSockeat, To Llibstwveitel "pen's IRESuLt))) 
catch 
针 
_Class:Err -> + 输出 结果 
gen _ tcp:send(Socket, io_lib:fwrite("~p~n", [Err])) 
end. . 
split Out mfalRawData) =» an 
MFA = re:replace (RawData, "\r\ns", "", [{return, list}]), 


{match, [M, F, A]} = 


re:run{(MeA, 
有 AN 0 
[icapture, [1,2,3], list}, ungreedy]), 
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{ligst to atom(M), list to atom(F}, args to terms (A})}}, . 


args to terms (RawArgs) -> 


{ok, Toks, _Line} = erl scan:string{("[" ++ RawArgs ++ "]. ", 1), 
{ok, Args} = erl parse:parse term!(Toks), 
Args. . 


纵 观 整个 代码 清单 ， 代 码 清单 3-6 中 的 代码 可 分 为 4 个 主要 部 分 : 切 分 输入 、 解 析 函 数 参 数 、 
执行 请 求 中 的 调用 , 以 及 回 传 结 末 。 背 和 完 , 可 以 看 到 go_rpc/2 孙 数 的 内 部 逻辑 被 悉数 包 右 在 try 
表达 式 内 (参见 2.8.2 市 )。 这 是 因为 你 需要 处 理 来 目 外 部 世界 的 数据 ， 可 能 会 出 现 各 种 错误 ， 而 
try 不 失 为 一 个 简单 易 行 的 月 尝 处 理 手段 ， 在 代码 朋 尝 时 ( 抛 出 异常 ) 打印 出 错误 信息 然后 继续 
执行 ， 总 好 过 整个 服务 右 进 程 朋 演 。 为 一 方面 ， 这 种 手段 无 法 对 付 3.3 方 中 即将 提 到 的 语法 和 语 
义 部 正确 的 恶意 代码 。 








边界 检查 

当 数 据 从 不 可 信 的 外 部 世界 进入 可 信 的 内 部 区 域 时 应 该 对 数据 进行 检查 ， 这 是 Erlang 程 
序 设计 的 一 个 基本 原则 。 倘若 经 过 验证 , 数据 符合 你 的 预期 , 就 没 必要 做 重复 检查 了 : 写 代码 
时 只 需 关注 正确 情况 即 可 , 剩 下 的 问题 可 以 全 权 交 由 监督 机 制 处 理 。 这 样 做 可 以 大 大 缩减 代码 
的 尺寸 , 编程 错误 的 数量 也 会 因 可 读 性 的 提升 而 减少 。 至 于 其 余 的 错误 , 由 于 你 并 不 刻意 掩饰 ， 
进程 因 前 溃 而 重启 时 它们 自然 会 被 日 志 记录 在 案 , 从 而 令 你 得 以 在 问题 出 现 的 第 一 时 间 着 手 解 
决 。 让 前 溃 来 得 更 猛烈 些 吧 ! 





首先 使 用 标准 库 中 的 re 模块 (Perl 兼容 的 正则 表达 式 ) 去 除 行 末 的 回 车 换行 全 。 剩 下 的 应 该 
是 形 如 Modul :Function (Arg1,...,ArgN) 的 格式 化 文本 , 该 格式 遵循 的 正 是 3.1 太 起 始 处 所 害 
义 的 协议 。( 否则 ， 你 的 代码 必 将 在 某 处 月 尝 ， 然 后 落 入 try 表 达 式 的 表演 处 理 逻 辑 。 ) 

接着 ,再 次 使 用 re 模块 , 分 别提 取出 Module、Function 和 Arg1,...,ArgN@, 正则 表达 式 
的 用 法 不 在 本 书 的 讨论 范畴 内 ， 详 情 请 参照 标准 库 文 档 。 模 块 名 和 函数 名 都 应 遵循 Erlang 原 子 的 
命名 规范 ， 这 样 才能 将 它们 从 字符 串 转 换 成 原子 。 

针对 参数 的 处 理 就 比较 复杂 了 。 人 参数 部 分 是 一 个 由 逗号 分 隔 的 项 式 列 表 , 其 中 可 以 包含 零 个 、 
0 或 多 个 参数 。 参数 处 理由 args_to_terms/1 完 成 ， 此 处 用 到 了 两 个 标准 库 函 数 ， 分 别 用 
于 将 字符 串 切 分 成 语 元 ， 以 及 将 语 元 解析 成 夏 正 的 Erlang 项 式 列表 。 














I/O 列表 : 轻松 实现 分 散 写 入 /集中 读 取 (scatter / gather) 

io_lib:fwrite/2 的 结果 不 一 定 是 普通 字符 事 ( 即 扁平 字符 列表 )。 即 便 如 此 ， 你 仍然 
可 以 直接 将 结果 传 给 套 接 字 ， 这 个 结果 被 称 为 IO 列表 : 它 是 一 个 可 以 深层 谱 套 的 列表 ， 既 可 
尺 包含 字符 编码 也 可 以 包含 二 进 制 数据 块 。 通 过 这 种 方式 ， 在 依次 输出 多 个 IO 列表 时 ， 就 不 
用 再 为 了 拼接 所 有 数据 而 专门 创建 一 个 中 间 列 表 了 : 你 只 需 创 建 一 个 包含 所 有 数据 段 的 列表 ， 
然后 将 之 整个 传 给 输出 流 即 可 。 这 很 类 似 于 现代 操作 系统 中 的 分 散 写 入 /集中 读 取 技术 *。 


中 实际 上 这 里 只 体现 出 了 分 散 写 入 。 一 一 译 者 注 
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随后 ， 将 模块 名 、 函 数 名 、 参 数 项 式 列表 传 给 内 置 函 数 apply/3@, 该 函数 与 spawn/3 非 党 
类 似 (参见 2.13 节 )， 但 它 并 不 会 启动 新 进程 一 它 用 于 执行 相应 的 函数 调用 ( 所 以 我 们 也 称 它 
为 元 调用 运算 符 ), 最 后 , 该 函数 的 返回 值 由 io_1ib: fwrite/2 转 换 为 格式 化 文本 @， 用 作 回 传 
给 用 户 的 响应 ， 通 过 套 接 字 发 送 回 去 一 一 至 此 ， 远 程 过 程 调用 执行 完毕 ! 

RPC 服 务 器 已 经 竣工 ， 可 以 运行 了 。 在 下 一 节 ， 你 可 以 尝试 运行 ， 看 看 它 能 否 正常 运转 。 




















3.3 ”运行 RPC 服务 器 


执行 本 的 第 一 步 就 是 编译 代码 。( 如 我 们 在 本 章 开 头 处 所 说 ， 你 可 以 在 GitHub.com 上 找到 完 
整 的 源码 。) 执行 命令 erlc tr_server.erl。 没有 出 现 错误 的 话 ， 当前 目录 下 就 会 多 出 一 个 名 
为 tr_server.beam 的 文件 。 在 同一 目录 下 启动 Erlang shell， 然 后 局 动 服务 需 : 


Eshell V5.6.2 (abort with ^G} 
1> tr server:start link{({1055}. 
{ok,<0.33.0>} 


此 处 我 们 选 了 一 个 很 好 记 的 端口 号 10$5$ ( 10 =$+5S$)。start_1Link 调 用 返回 了 一 个 元 组 ， 
包含 原子 ok 和 新 服务 右 进 程 的 进程 标识 符 ( 不 过 当前 你 还 用 不 上 它 )。 

接 下 来 ， 癌 1055 问 口 发 起 一 个 Telnet 会 话 。 在 大 部 分 系统 上 ， 和 耻 接 在 系统 shell 提 示 符 下 (不 
是 Erlang shell ) 输入 telnet localhost 1055 即 可 (不过,， 某 些 版 本 的 Windows 上 没有 
Telnet 一 一 需要 的 话 可 以 去 下 载 一 个 免费 的 Telnet 客 户 端 ， 比 如 PuTTY )。 例 如 : 


$ telnet localhost 1055 

Trying 127.0.0.1... 
”Connected to localhost. 

Escape character 1is '^]'. 




















init:stop!(}). 
Ok 
Connection closed by foreign host. 


首次 会 话 成 功 ! 为 什么 这 么 说 ?让 我 们 来 仔细 分 析 一 下 整个 会 话 过 程 , 看 看 到 底 发 生 了 些 什么 。 

首先 ， 你 用 Telnet 通 过 TCP 的 105$ 冰 口 连接 至 运行 中 的 trz_server。 连 接 成 功 后 ， 你 输入 了 
文本 init:stop().， 服务 从 随即 谈 取 并 解析 这 段 文本 。 可 以 预料 到 服务 硕 将 会 调用 apply (init， 
stop，[])。 同 时 你 也 知道 init:stop/0 会 返回 原子 ok， 这 与 你 看 到 的 打印 结果 相符 。 不 过 接 
下 来 你 看 到 的 却 是 “Connection closed by foreign host.”。 这 是 Telnet 打 印 的 ， 因 为 突然 间 远 程 端 连 
接 的 套 接 字 被 天 财 了 了 。 这 是 因为 init:stop() 关 财 了 运行 看 RPC 服 务 硕 的 整个 Erlang 帮 点 。 这 个 
例子 不 仅 演示 了 RPC 服 务 天 的 工作 原理 , 还 演示 了 让 人 不 受 限制 地 在 你 的 节点 上 随意 运行 代码 是 
多 么 危险 ! 你 可 以 在 后 续 的 改进 版 本 中 对 用 户 做 出 限制 , 令 用 户 只 能 调用 特定 的 子 数 ,你 其 至 还 
可 以 配置 这 些 限 制 。 














服务 器 不 应 该 调用 自身 
通过 RPC 服务 器 ， 你 可 以 调用 服务 器 端 任意 模块 中 导出 的 任意 函数 ， 只 有 一 个 例外 : 你 
自己 的 tr_servetr:get_count/0。 一 般 来 说 ， 服 务 器 不 能 调用 自己 的 API 函数 。 假 设 你 在 
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某 个 回调 中 向 同一 个 服务 器 发 起 一 个 同步 调用 : 比如 ， 试 图 在 hanale info/2 中 调用 
get_count/0API 函数 。 这 种 情况 下 , 服务 器 向 自己 发 起 gen_server:call(...) 调 用 请 求 。 
而 该 请 求 只 有 在 handle_info/2 返回 后 才能 得 到 处 理 , 从 而 引发 循环 等 待 一 一 服务 器 便 会 陷 
入 死 锁 。 





总 结 下 来 , 没 用 多 少 行 代码 ,你 就 构建 出 了 一 个 切实 可 用 的 应 用 (不 过 还 得 略微 做 些 调整 )。 
更 重要 的 是 ， 这 是 个 能 够 与 OTP 框 架 融 合 的 稳定 的 应 用 。 


3.4 ” 浅 谈 测试 


作为 一 名 严谨 的 开发 者 ,收工 之 前 你 还 有 一 件 事情 要 做 : 添加 测试 。 不 少 人 会 争 兴 说 从 一 开 
就 应 该 进行 测试 ,你 应 该 用 测试 来 引导 开发 过 程 才 对 。 但 在 示例 中 增加 测试 代码 会 干扰 我 们 的 
视线 ， 偏 离 我 们 的 主旨 。 毕 竟 这 本 书 讲 的 是 OTP 框 架 ， 而 不 是 测试 。 而 且 ， 你 在 此 开发 的 都 是 并 
发 分 布 式 系统 ， 要 给 它们 编写 测试 ， 其 间 的 奥秘 本 号 就 足够 号 上 一 两 本 书 了 。 

有 两 个 层面 的 测试 与 开发 者 直接 相关 : 单元 测试 和 集成 测试 。 单元 测试 关注 的 是 编写 一 键 运 
行 的 测试 ， 这 些 测试 针对 的 是 程序 中 的 某 些 特定 属性 ( 每 个 测试 最 好 只 禾 关 其 中 一 个 属性 )。 集 
成 测试 则 更 注重 于 测试 多 个 独立 开发 的 组 件 之 间 的 协同 工作 , 并 且 往 往 需 要 先进 行 一 些 人 工 设置 
才能 运行 。 

Erlang/OTP 标 准 发 布 镜像 中 包含 两 个 测试 框架 : EUnit 和 Common Test。EUnit 主 要 用 于 单元 
测试 ， 它 的 目的 在 于 尽量 简化 开发 过 程 中 测试 代码 的 编写 和 运行 。Common Test 基 于 所 谓 的 OTP 
Test Server， 是 个 更 加 重型 的 框架 ， 通过 它 你 可 以 一 边 在 一 台 或 多 台 机 右上 运行 测试 ， 一 边 将 测 
试 结果 集中 记录 到 运行 看 框架 的 机 和 右上。 它 更 适合 于 运行 晚间 例 行 集成 测试 等 大 规模 测试 。 你 可 
以 在 Erlang/OTP 文 档 的 工具 一 廊 找 到 关于 这 两 个 框架 的 详细 介绍 。 

在 此 我 们 癌 你 简要 介绍 一 下 如 何 使 用 EUnit 编 写 测 试用 例 , 非常 简单 。 首先 , 在 -module(...) 
声明 后 面 加 入 一 行 代码 : 

-include 1lib({"eunit/include/eunit.hrl"). 

最 厅 烦 的 部 分 便 就 此 处 理 完毕 了 。 接 下 来 , 找 些 东西 来 测 一 测 吧 ! 比如 ， 你 可 以 测试 一 下 服 
“ 务 需 能 和 否 成 功 局 动 。 测 试 代 码 必 须 放 在 函数 内 ， 该 图 数 必须 没有 任何 参数 且 果 数 名 要 以 _test 结 
尾 。EUnit 探 测 出 这 些 函 数 后 会 将 它们 统统 当 作 测试 。 如 果 测 试 函 数 正常 返回 ， 便 视 作 成 功 ; 如 
采 抛 出 异 第 ， 便 视 作 失败 。 因 此 ， 你 的 测试 可 以 写成 : 


start test{() -> 
{ok, _} = tr server:start link{({1055). 


回想 一 下 ,= 是 匹配 运算 符 ， 如 有 果 右 侧 的 值 无 法 匹配 左 侧 的 模式 , 该 运算 符 将 抛 出 bagmatch 
错误 。 也 就 是 说 只 有 服务 冀 成 功 启动 该 函数 才能 正常 返回 ; 对 于 任意 其 他 情况 ，start_test () 
都 会 引发 异 肖 。 就 是 这 么 简单 ! 

要 运行 测试 ， 必 须 先 重 新 编译 模块 。 然 后 ， 你 可 以 在 Erlang shell 输 入 : 


eunit:test (tr server}). 
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或 者 

tr server:test!(). 

二 者 效果 相同 : 作用 都 是 运行 tr_server 模 块 中 的 所 有 测试 。 请 注意 你 并 未 编写 过 名 为 test () 
的 函数 : 该 函数 是 由 EUnit 自 动 生 成 的 ， 同 时 EUnit 会 自动 导出 你 编写 的 所 有 测试 函数 。 

EUnit 的 很 多 特性 可 以 帮助 你 写 出 极为 紧 竣 的 测试 代码 ， 其 中 包括 一 系列 实用 的 宏 ， 它 们 会 
随 着 你 所 包含 的 eunit.hrl 尖 文件 自动 加 载 进 来 。 我 们 建议 你 通过 阅读 Erlang/OTP 文 档 中 的 EUnit 用 
户 手册 来 获取 更 多 相关 信息 。 























3.5 ”小结 


我 们 在 本 章 涵 凑 了 大 量 内 容 , 纵 观 了 OTP 行 为 模式 的 各 种 基础 知识 以 及 构成 这 些 行 为 模式 的 
3 个 组 成 部 分 : 接口 、 容 磊 和 回调 模块 。 我 们 还 通过 实际 示例 深入 介绍 了 gen_server 行 为 模式 。 

在 下 一 革 中 ， 这 个 小 巧 独立 的 通用 RPC 服 务 冰 将 被 搭载 进 更 大 的 结构 之 中 ， 成 为 一 个 企业 
级 OTP 应 用 。 迈 出 这 一 步 之 后 ， 你 的 服务 需 便 会 演变 成 一 个 版 本 化 的 、 容 错 的 应 用 ， 既 可 以 在 
其 他 项 目 中 为 他 人 所 用 ， 也 可 以 直接 上 线 投 产 。 下 一 童 将 会 讲授 基本 的 容错 结构 (监督 者 ) 以 
及 将 各 种 功能 打包 成 精 民 的 OTP 包 的 方法 ， 这 些 内 容 将 会 让 你 对 Erlang/OTP 框 架 的 基本 认识 更 
上 一 层 楼 。 
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OTP 应 用 与 监督 机 制 


本 章 概要 

口 OTP 应 用 简介 

口 用 OTP 监 督 者 实现 容错 
口 用 EDoc 生 成 文档 





整个 Erlang/OTP 生 态 系 统 的 日 的 就 在 于 构建 稳定 、 容 错 的 系统 。 我 们 在 第 3 章 介 绍 了 该 生态 
系统 中 的 核心 概念 ， 并 搭建 了 一 个 人 简单 的 RPC 服 务 絮 ; 现在 我 们 将 更 进一步 ， 教 你 如 何 合理 地 将 
这 个 应 用 打包 成 容错 的 、 产 品级 质量 的 服务 。 为 此 ， 我 们 先 要 介绍 两 个 新 的 基本 概念 。 
口 应 用 是 Erlang 对 相关 模块 进行 打包 的 一 种 手段 。 打 包 的 目的 并 不 在 于 发 布 ， 而 在 于 使 这 些 
模块 成 为 一 个 整体 。 有 一 部 分 OTP 应 用 仅仅 是 供 他 人 调用 的 库 代 码 , 但 大 部 分 应 用 都 具有 
目 己 的 生命 周期 : 启动 ， 完 成 预 设 任务 ， 最 后 关闭 。 部 分 应 用 可 以 同时 运行 多 个 实例 ， 
另 一 些 应 用 则 仅 限 一 个 。 

口 监督 者 是 OTP 最 为 重要 的 一 个 特性 。 它 们 负责 监控 其 他 进程 , 并 在 出 现 问题 时 重启 故障 进 
程 或 同上 汇报 侦 测 到 的 问题 。 你 还 可 以 将 监督 者 分 层 组 织 成 监督 树 进 而 构建 出 高 度 可 靠 
的 容错 系统 。 

在 本 章 中 ， 我 们 不 打算 深入 介绍 应 用 和 监督 者 的 理论 及 实践 。 我 们 将 集中 精力 武装 第 3 草 中 
搭建 的 模块 ,把 它 包 装 成 一 个 OTP 应 用 并 为 它 设置 监督 者 。 我 们 会 讨论 全 章 各 项 任务 的 大 部 分 基 
本 要 点 ， 并 阐述 每 个 步骤 背后 的 动机 。 等 到 迈 入 本 书 的 第 2 部 分 后 ， 我 们 还 将 详细 讨论 用 于 高 级 
监督 功能 和 应 用 代码 升级 处 理 的 各 种 有 意思 的 选项 ， 而 且 还 会 将 多 个 应 用 进一步 逆 配 成 更 大 的 、 
称 为 发 布 镜像 (release ) 的 结构 。 


























4.1 OTP 应 用 


站 和 完 我 们 来 看 看 代码 应 该 经 由 怎样 的 组 织 才 能 有 效 融 入 正常 的 Erlang/OTP 系 统 。 出 于 种 种 原 
， 这 个 问题 困扰 过 很 多 新 手 。 刚 刚 接触 Erlang 时 ，OTP 简 直 就 像 是 某 种 暗黑 魔法 ， 文 档 拙劣 、 
示例 奇 缺 。 我 们 一 路 崎 由 ， 不 断 试 错 ， 顺 着 Erlang 邮 件 列表 中 的 各 位 前 辈 的 点 滴 指 引 艰 难 地 学 习 
着 这 和 套 蝇 大 的 系统 。 所 羊 在 措 清 了 基本 概念 之 后 ， 事 情 还 是 相当 简单 明了 的 。 
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术语 : 应 用 

在 OTP 环境 下 ， 应 用 一 词 有 着 特殊 的 含义 : 应 用 就 是 由 磁盘 上 的 一 系列 模块 和 若干 额外 
的 元 数据 文件 按 一 定 规范 组 织 起 来 形成 的 软件 组 件 。 通过 这 种 组 织 方 式 , 系统 便 可 以 知晓 当前 
已 经 安装 了 哪些 应 用 ， 同 时 也 让 你 能 够 按 应 用 名 来 启动 或 停止 应 用 。 

从 现在 起 ， 除 非特 别 说 明 ， 否 则 我 们 所 说 的 应 用 都 是 OTP 意义 下 的 应 用 。 


浅显 地 说 ，OTP 应 用 无 非 就 是 一 组 相互 关联 的 代码 。 我 们 将 其 中 一 部 分 称 为 库 应 用 这 些 应 
用 纯粹 是 供 其 他 应 用 调用 的 一 系列 模块 的 集合 。( Erlang/OTP 的 stalipb 就 是 库 应 用 的 一 个 实 
例 。) 还 有 一 些 应 用 则 更 为 第 见 ， 它 们 具有 上 自己 的 生存 周期 ， 启 动 之 后 会 运行 上 一 段 时 间 ， 最 后 
终 目 。 我 们 将 这 类 应 用 称 为 主动 应 用 。 每 个 主动 应 用 都 配 有 一 个 负责 对 应 用 进程 进行 管理 的 根 监 
和 督 者 。 我 们 将 在 4.2 节 详细 介绍 监督 者 。 











4.1.1 OTP 应 用 的 组 织 形式 


创建 OTP 应 用 时 的 主要 工作 集中 于 标准 目录 结构 的 建立 和 应 用 元 数据 的 编写 。 元 数据 的 作用 
在 于 让 系统 获悉 应 该 如 何 启动 和 集 止 应 用 , 还 可 用 于 指定 应 用 的 依赖 项 , 也 就 是 在 应 用 局 用 前 必 
须 预先 安装 或 启动 哪些 其 他 应 用 。 创建 主动 应 用 时 ,还 需要 写 一 点 儿 代码 ， 这 部 分 内 容 将 在 4.1.3 
节 详 述 。 

















主动 应 用 与 库 应 用 

主动 应 用 与 库 应 用 采用 的 是 相同 的 目录 结构 和 元 数据 文件 ， 都 可 以 融入 OTP 整体 应 用 框 
架 。 二 者 之 间 的 主要 区 别 就 在 于 主动 应 用 具有 一 定 的 生命 周期 ， 必 须 先 局 动 才能 发 挥 作 用 。 与 
之 相反 ， 库 应 用 只 是 一 组 供 其 他 应 用 调用 的 被 动 模块 集 ， 不 涉及 应 用 局 停 。 由 于 本 书 的 重点 在 
于 主动 应 用 的 开发 ， 除 非特 殊 说 明 ， 否 则 我 们 所 提 及 的 应 用 都 是 指 主动 应 用 。 


如 图 4-1 所 示 ，Erlang/OTP 应 用 的 目录 布局 很 简单 。 许 多 熟悉 Erlang 但 却 不 了 解 OTP 的 人 在 开 
发 应 用 时 采用 的 也 是 这 个 目录 结构 ， 只 是 没有 用 上 元 数据 。 








<application-name>[-<version>] 















































图 4-1 OTP 应 用 的 目录 布局 。 目 录 名 可 以 包含 版 本 号 。 标 准 子 目录 包括 doc 、ebin、 
include 、priv 和 src， 其 中 只 有 ebin 是 必需 的 





其 中 <application-name> 显 然 应 该 换 成 你 目 己 的 应 用 名 ,此 处 是 tcp_rpco[-<version>] 
是 可 选项 : 开发 时 用 不 到 它 ， 但 在 交付 时 通常 会 采用 tcp_rpc-1.0.2 这 样 的 目录 名 ， 这 样 做 可 
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以 徐 化 今后 的 代码 升级 工作 。 图 4-1 中 列 出 的 各 个 子 目 录 的 作用 光 看 目录 名 便 一 目 了 然 ， 不 过 我 
们 还 是 在 表 4-1 中 给 出 了 详细 描述 。 
表 4-1 应 用 目录 下 的 子 目 录 
目 录 描 述 
doc 用 于 存放 文档 。 如 果 文 档 是 用 EDoc 生 成 的 ， 请 将 overview.edoc 文 件 放 在 此 处 ， 其 余 的 文件 将 会 自动 生成 


ebin 用 于 存放 编译 后 的 代码 (.beam 文 件 ) 。 含 有 应 用 元 数据 的 .app 文 件 也 应 存放 在 此 处 


include ”用 于 存放 公共 头 文 件 。 所 有 作为 公共 API 的 一 部 分 的 .hrl 文 件 都 应 该 放 在 这 个 目录 中 。 仪 用 于 你 自己 的 代 
码 之 中 且 不 打算 公开 的 私有 .hrl 文 件 则 应 该 与 其 余 的 源码 文件 一 起 放 在 src 目 录 下 


priv 用 于 存放 各 种 需要 随 应 用 一 起 发 布 的 其 他 内 容 。 包 括 但 不 限于 模板 文件 、 共 享 对 象 文件 和 DLL 等 。 定 位 
应 用 priv 目 录 的 方法 很 简单 : 调用 code:priv_dir(<application-name>)， 便 会 以 字符 串 形式 导 到 | 








priv 目 录 的 完整 路 径 
STC 用 于 存放 应 用 的 源码 。 不 仅 包 括 Erlang 的 .eq 文件 和 内 部 .hz 文件 ， 也 包括 ASN.1、YECC、MIB 等 其 他 源 








文件 (如 果 不 打 算 随 应 用 一 起 发 布 源码 ， 可 以 省 去 该 目录 或 将 目录 留 空 。) 
请 立即 按照 这 个 结构 建立 好 相应 的 目录 ， 然 后 把 第 3 章 的 源码 放 入 src 目 录 中 ，。 


4.1.2 ”为 应 用 添加 元 数据 


应 用 的 目录 结构 已 经 建立 完毕 ， 可 以 添加 OTP 所 需 的 元 数据 了 。 这 些 元 数据 以 普通 Erlang 项 
式 描 述 ， 位 于 ebin 目 录 下 的 一 个 名 为 <application-name>.app 的 文本 文件 中 。 代 人 码 清 单 4-1 展 示 了 了 
ebin/tcp_Tpc.app 文 件 ， 也 就 是 tcp_ rpc 应 用 的 元 数据 。 


代码 清单 4-1 应 用 元 数据 文件 : ebin/tep_rpc.app 


务 委 -xx- mode: Erlang; fill-column: 75; comment-column: S50; 一 = 一 








{application, tcp_ rpe, 
[ {description, "RPC server for Erlang and OTP in action"}, 
{Ven, "0.1].0"]}, 
{modules, [tr app, 

tr_sup, 





tr server]}, 
{registered, [tr sup]}, 
{applications, [kernel, stdlib]l}, 
imod; {tr App, Ll}} 

]}. 


这 个 .app 文 件 的 作用 在 于 告诉 OTP 如 何 启 动 应 用 ， 以 及 该 应 用 应 该 如 何 与 系统 中 的 其 他 应 用 
相 融 合 。 再 重复 一 裔 ， 我 们 的 站 要 目的 并 不 在 于 打包 发 布 ， 而 在 于 组 痰 更 大 的 可 启动 、 停 止 、 监 
督 和 升级 的 功能 单元 。 

.app 文 件 的 格式 很 和 测 明 。 除 去 注释 ， 只 剩 下 一 个 由 句号 结尾 的 Erlang 项 式 : 三 元 组 
1a8D01iCaLIOn, soay Reel 其 中 第 一 个 元 素 是 应 用 名 称 所 对 应 的 原子 ， 此 人 处 即 是 tcp_rpc。 
第 三 个 元 素 是 个 参数 列表 ， 其 中 每 个 参数 都 是 {key，vValue} 对 的 形式 ， 有 些 是 必需 的 ， 有 些 
年 可 选 的 。 此 处 罗列 的 是 大 部 分 应 用 都 会 用 到 的 最 为 重要 的 那些 参数 , 在 本 书 第 二 部 分 我 们 还 将 
详 述 这 部 分 内 容 。 表 4-2 按 代码 清单 4-1 中 的 出 现 顺序 分 别 描述 了 这 些 参数 。 
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表 4-2 .app 文件 中 的 主要 参数 


参 数 摘 述 
description 针对 应 用 的 简短 描述 。 通 党 只 有 一 两 句 话 ， 但 你 想 写 多 长 都 可 以 
Vsn 应 用 的 版 本 。 版 本 可 以 用 任意 字符 串 表 示 , 但 我 们 建议 你 坚持 采用 标准 的 < 主 版 本 号 >.< 次 版 本 








号 >.< 修 订 版 本 号 > 格式 : 虽然 Erlang/OTP 本 身 并 不 关心 你 使 用 什么 字符 串 来 表示 应 用 的 版 本 ， 
但 某 些 程序 会 出 于 特定 目的 自行 解析 应 用 的 版 本 字符 串 , 胡乱 选取 版 本 字符 串 很 可 能 会 让 这 些 


程序 功能 错乱 

modules 应 用 中 的 模块 列表 。 这 个 清单 的 维护 工作 甚 是 乏味 ,不 过 有 现成 的 工具 可 以 助 你 一 臂 之 力 。 模 
块 在 列表 中 的 顺序 无 关 紧 要 ， 但 按 字 典 序 对 模块 进行 排序 会 较为 易于 维护 

registered 我 们 知道 ， 对 Erlang 进 程 进行 注册 (2.13.3 布 ) 后 ， 便 可 以 用 注册 名 来 定位 进程 。 这 种 手法 党 


用 于 系统 服务 等 场合 。 在 .app 文 件 中 罗列 出 所 有 进程 注册 名 并 不 会 促使 系统 执行 实际 的 注册 操 
作 , 但 这 可 以 告知 OTP 系 统 哪 个 进程 注册 了 哪个 名 字 ， 从 而 为 系统 升级 等 操作 提供 便利 ， 同 时 
也 可 以 尽早 发 现 重复 的 注册 名 并 给 出 人 警告 

application 必须 在 该 应 用 启动 前 先行 启动 的 所 有 应 用 。 应 用 往往 会 依赖 于 其 他 应 用 。 主动 应 用 要 求 自己 
所 依赖 的 所 有 应 用 在 自己 的 生命 周期 开始 之 前 先行 启动 并 就 绪 。 列表 中 各 应 用 的 顺序 无 关 紧 
要 一 一 OTP 很 智能 ， 它 会 纵 观 整个 系统 并 明 辨 每 个 应 用 的 启动 时 机 

mod 告知 OTP 系 统 应 该 如 何 启 动 应 用 。 该 参数 的 值 是 一 个 元 组 ， 其 内 容 为 一 个 模块 名 以 及 一 些 可 选 
的 启动 参数 。 (不 要 把 通用 配置 信息 写 到 这 些 参 数 中 一 一 请 使 用 正规 的 配置 文件 来 存放 通用 配 
置信 息 。) 这 个 模块 必须 实现 application 行 为 模式 ， 请 参见 4.1.3 市 


截至 目前 为 止 ， 你 已 经 建立 了 应 用 的 目录 结构 ， 元 数据 也 已 经 就 位 。( 如 果 尚 未 创建 
ebin/tcp rpc.app 文 件 ， 请 先 创建 该 文件 。) 但 整个 应 用 还 远 未 完工 。 表 4-2 中 mog 的 描述 中 曾 提 到 ， 
你 的 应 用 还 需要 一 个 启动 人 口 ， 它 必须 是 application 行 为 模式 的 一 个 实现 模块 。 下 一 小 节 将 
详 述 这 个 环节 。 


4.1.3 ”应 用 行为 模式 


每 个 主动 应 用 都 配 有 一 个 application 行 为 模式 的 实现 模块 。 该 模块 用 于 实现 系统 启动 逻 
辑 。 它 至 少 要 负责 根 监督 者 的 局 动 , 该 监督 者 将 成 为 应 用 中 其 他 所 有 进程 的 蜡 祖 ,根据 系统 需要 ， 
应 用 行为 模式 模块 还 可 以 完成 一 些 其 他 任务 。 我 们 将 在 4.2 节 详细 阐述 监督 者 。 现 在 ， 证 我 们 将 
注意 力 集中 到 src/tr app.erl 文 件 中 应 用 行为 模式 的 实现 上 ， 如 代码 清单 4-2 所 示 (去掉 了 注释 )。 





















































应 用 行为 模式 的 命名 
应 用 行为 模式 的 实现 模块 通常 被 命名 为 <application-name> app。 


代码 清单 4-2 ”应 用 行为 模式 : src/tr_app.erl 
-module{tr app). 
加 行为 模式 声明 


-behaviour (application}). 


-exporttlI 
start/2, 应 用 行为 模式 的 
stop/1 回调 函数 
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ks 


start( Type, StartArgs) -> 


case tr_sup:start_ link() of < 二 一 启动 根 
{ok, Pid} -> 监督 者 
{ok, Pid}:; 
Other -> 


{error, Other} 
end. 


stop{_State}) -> 
OK . 


这 个 小 模块 应 该 很 容易 理解 , 如果 需 要 , 你 可 以 癌 前 查阅 第 2 章 来 复习 行为 模式 的 实现 模块 。 
在 这 里 ， 你 实现 了 一 个 application 行 为 模式 ， 该 行为 模式 要 求 导 出 两 个 回调 start/2 和 
stop/1。( 这 个 模块 没有 任何 用 户 API， 因 此 除了 这 两 个 回调 以 外 这 里 别 无 其 他 导出 疯 数 。) 

此 处 的 stop/1 回 调 很 简单 : 应 用 关闭 时 无 须 做 出 任何 特殊 人 处理 ， 忽 略 输 入 参数 并 直接 返回 
ok 即 可 。 在 正 让 人 操心 的 是 start/2。OTP 系 统 会 在 应 用 即将 局 动 时 调用 该 函数 ， 它 负 贡 完成 实 
际 的 局 动工 作 并 以 {ok，Pigd} 的 形式 返回 根 监督 者 的 进程 ID。 其 他 各 种 需要 在 应 用 启动 时 完成 的 
任务 ， 如 配置 文件 的 谈 取 、ETS 表 的 初始 化 等 ， 也 可 以 在 此 进行 。 仅 就 这 个 简单 的 tcp_rpc 应 用 而 
言 ， 我 们 只 需 调 用 tr_sup:start_link() 因数 (尚未 提 及 ) 来 启动 根 监 督 者 便 可 。( 监督 者 模 
块 tt sup 留待 后 续 的 4.2 方 实现。) 紧 接 着 你 得 检查 start_1ink() 的 返回 值 , 如 果 不 对 劲 就 立即 上 
报 一 个 错误 。start/2 的 输入 参数 暂时 可 以 忽略 ,不 过 为 了 满足 你 的 好 奇 心 ， 我们 解释 一 下 ， 此 
外 的 Type 一 般 取 值 为 normal,， 但 也 可 能 是 {failover, ...} 或 {takeover,...}, StartArgs 
则 是 你 在 .app 文 件 中 传 给 mod 的 参数 。 


4.1.4 应 用 结构 小 结 


总 结 一 下 ， 建 立 OTP 应 用 要 做 3 件 事 : 

(1) 芝 循 标准 目录 结构 ; 

(2) 添加 用 于 存放 应 用 元 数据 的 .app 文 件 ; 

(3) 创建 一 个 application 行 为 模式 实现 模块 ， 负 责 局 动 应 用 。 

另外 还 有 一 个 有 竺 探讨 的 细节 ， 束 是 应 用 行为 模式 中 的 start/2 函 数 是 如 何 局 动 根 监督 者 
的 。 主 动 应 用 的 目的 就 在 于 局 动 一 个 或 多 个 进程 以 完成 特定 的 任务 。 为 了 加 强 控制 ， 这 些 进 程 应 
该 由 监督 者 一 一 也 就 是 实现 了 supervisor 行 为 模式 的 进程 一 一 统一 派生 和 管理 。 

nt 


4.2 ”用 监督 者 实现 容错 


监督 者 是 Erlang/OTP 的 核心 之 一 。 主 动 OTP 应 用 由 一 个 或 多 个 进程 组 成 ， 它 们 相互 协作 共同 
完成 任务 。 监 督 者 间接 启动 这 些 进 程 ， 对 这 些 进程 负责 ， 并 在 必要 时 重启 它们 。 本 质 上 说 ,在 运 
行 时 ， 应 用 就 是 一 棵 由 监督 者 和 工作 进程 共同 构成 的 进程 树 ， 树 根 就 是 根 监督 者 。 图 4-2 展 示 了 
一 个 可 能 的 假想 应 用 的 进程 结构 。 
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根 监 督 者 


工作 者 ”工作 者 


图 4-2 某 假 想 应 用 的 进程 树 。 这 个 例子 包含 一 个 根 监 督 者 、 一 个 由 根 监督 者 直接 派 生 
的 工作 进程 和 一 个 子 系统 的 监督 者 ， 该 子 系统 本 里 又 由 为 外 两 个 工作 进程 组 成 


你 可 以 通过 编写 supervisozr 行 为 模式 的 实现 模块 来 创建 监督 者 。 如 果 工 作 进 程 本 身 就 是 基 
于 OTP 行 为 模式 的 ( 如 tr_server )， 为 其 设置 监督 者 将 会 很 容易 。gen_server 、gen_event 
和 gen_fsm 等 标准 OTP 工 作者 行为 模式 融入 监督 树 的 方式 一 点 儿 也 不 神奇 一 一 无 非 就 是 实现 一 
些 接口 、 遵 循 返回 值 方面 的 约定 并 设置 好 进程 间 的 链接 。 幸 运 的 是 ， 你 不 必 了 解 其 中 的 详情 。 如 
果 监 督 树 中 碰巧 出 现 了 未 遵守 标准 行为 模式 的 代码 ， 你 可 以 借助 标准 库 中 的 supervisor bridge 适 
配 需 来 处 理 相 关 问 题 。 


根 监督 者 行为 模式 模块 的 命名 
根 监督 者 行为 模式 的 实现 模块 通常 被 命名 为 <application-name> sup。 




















4.2.1 实现 监督 者 


代码 清单 4-3 展 示 的 是 src/tr_sup.erl， 也 就 是 tcp_rpc 应 用 的 根 监 督 者 的 实现 。 相 较 于 tr_app, 该 
模块 要 稍微 复杂 一 些 ， 特 别 是 除了 行为 模式 接口 的 回调 之 外 ， 这 个 模块 还 提供 了 一 个 API 函 数 。 
通过 它 你 才能 在 tr app 模 块 中 启动 监督 者 。( 实际 上 ，tr_sup:start_ link() 完 全 可 以 融入 
tr_app:start/2, 不 过 我 们 倾 问 于 将 这 部 分 职能 隔离 出 来 ， 而 不 是 把 监督 者 相关 的 逻辑 混入 _app 
模块 。) 


代码 清单 4-3 ” 根 监 督 者 实现 


-modulet{tr sup). 

















-behaviour (supervisor). 


多 及 ET 
-export([start link/0]). 


SS Supervisor callbacks 
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-export{( [init/1])}). 


-define (SERVER, ?MODULE). 


Oe 
start link{(} -> 
Supervisor:start lJ]ink({local, ?SERVER}, ?MODULE, [1]}. 
init([]) -> Wi is 
Server = {tr server, {tr server, start Jink, [1}, 
permanent, 2000, worker, [tr serverl|}, 
Children = [Serverl], 有 
RestartSstrategy = {one for one，0，1)}， 





{ok, {Restartstrategy, Children}}. Se 
| 返回 监督 规范 


start_1ink()API 函 数 仅 负 责 监 督 者 的 启动 ， 具 体 来 说 就 是 以 模块 名 为 参数 调用 库 函 数 
supervisor:start link/3 1 a 旺 代 位 清单 3-3 中 通过 gen_servez : Start link/4 局 动 
tr_server 的 方法 类 似 。) 其 中 第 一 个 调用 参数 是 二 元 组 {local，?SERVER}， 用 于 让 OTP 库 
在 本 地 市 点 上 以 tr_sup 为 注册 名 上 自动 注册 监督 进程 ( SERVER 的 定义 与 MODULE 相 同 ), 第 三 个 
参数 是 传 给 回调 函数 init/1 的 启动 参数 。 由 于 init/1 无 须 任何 输入 参数 ， 此 处 仪 需 传人 一 个 
空 表 。 

真正 有 意思 的 内 容 都 集中 在 init/1 函 数 里 。 子 进程 的 启动 策略 、 管 理 策略 全 以 及 监督 者 进 
程 本 身 的 行为 全 都 是 经 由 该 也 数 的 返回 值 告知 给 OTP 监 督 者 库 的 。 

监督 者 可 以 完成 多 种 任务 , 本 书 的 第 二 部 分 将 对 此 进行 细致 的 考察 。 现 阶段 你 只 需要 理解 这 
个 条 例 中 涉及 的 内 容 就 可 以 了 。 我 们 不 妨 由 浅 入 深 : 先 从 重启 集 略 讲 起 。 


4.2.2 监督 者 重 局 案 略 


工科 工 七 /二 回调 函数 的 返回 值 的 格式 为 {ok,， {RestartStrategy, Children}},, 其 中 
children 是 奋 干 子 进程 规范 组 成 的 一 个 列表 ， 这 些 规 范 比 较 复 杂 ， 我 们 留待 下 一 节 详 述 。 
RestartSttrategy 则 比较 简单 ， 它 只 是 一 个 三 元 组 (How，Max，Within}y， 此 处 它 的 值 是 : 




















ResSstartStratregy = {one_for_one, 0, 1} 

这 里 的 How 取 值 为 one_for_one, 表示 一 旦 有 子 进 程 退 出 ,监督 者 将 针对 该 进程 ， 且 仪 针 对 
该 进程 进行 重启 。 该 重启 操作 不 会 影响 同时 运行 的 其 他 进程 ， 如 图 4-3 所 示 。( 本 书后 续 内 容 中 还 
会 介绍 其 他 策略 。 例 如 ， 某 些 集 略 会 对 子 进 程 进 行 编组 , 组 中 任意 一 个 进程 的 意外 终止 都 将 导致 
整个 进程 组 的 重启 。) 

Max 和 within 这 两 个 值 ( 此 处 分 别 取 值 为 0O 和 1 ) 是 相互 关联 的 : 它们 共同 确定 了 重启 频率 。 
第 一 个 值 指定 的 是 最 大 重 局 次 数 ， 第 二 个 值 指定 的 是 时 间 族 。 例 如 ， 当 Max=10、WwWithin=30 时 
表示 监督 者 最 多 可 以 在 30 秒 内 重启 子 进 程 10 次 。 一 旦 超过 限制 , 监督 者 就 会 在 终止 所 有 子 进程 后 
自我 了 断 ， 并 顺 着 监督 树 向 上 汇报 故障 信息 。 这 些 数值 的 取 值 很 大 程度 上 取决 于 应 用 本 刁 ， 因 此 
我 们 无 法 在 此 给 出 一 个 普 适 的 推荐 值 ， 不 过 生产 系统 中 经 常会 将 该 频率 设置 为 每 小 时 ( 3600 秒 ) 
4 次 。 此 处 这 两 个 值 分 别 取 值 为 0 和 1 表示 目前 不 局 用 目 动 重 局 ， 因 为 目 动 重 局 会 妨碍 我 们 发 现代 
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人 码 中 的 淤 在 问题 。 错 误 日 志和 重 司 事件 的 检测 将 留待 第 7 章 讨 论 。 

下 面 来 看 init/1 返 回 值 中 的 chilaren 部 分 。 这 是 一 个 元 组 列表 , 其 中 每 个 元 组 表示 一 个 受 
监督 的 子 进 程 。 在 这 个 案例 中 ， 子 进程 只 有 一 个 ， 即 你 的 服务 条。 该 列表 长 度 不 限 ， 同 时 管理 半 
打 子 进程 的 监督 者 也 不 少见 。 监督 者 也 可 以 在 局 动 后 动态 增删 子 进程 , 但 大 多 数 情况 下 这 种 静态 
列表 就 足以 满足 需要 了 。 


-7 


图 4-3 ”一 对 一 重启 条 略 : 监督 者 在 需要 重启 子 进程 时 将 各 个 子 进程 看 作 相互 独立 的 个 
体 。 崩 沉 的 子 进程 不 会 影响 正常 的 子 进程 




















4.2.3 ”编写 子 进程 规范 


子 进 程 规范 是 一 个 用 于 描述 受 监 督 者 管理 的 进程 的 元 组 。 对 于 大 多 数 监 督 者 而 言 , 子 进程 会 
随 监督 者 的 启动 而 启动 并 在 监督 者 的 生命 周期 结束 时 退出 。 对 于 单个 需要 监督 的 进程 ，init/1 
中 数 给 出 的 描述 如 下 : 


Server = {tr server, {tr server, start link, []}, 
Permanent, 2000, worker, [tr server]} 











子 进 程 规 范 由 6 个 元 隶 组 成 : {ID, Start, Restart, Shutdown, Type, Modules}.。 

口 第 一 个 元 素 ID ， 是 一 个 用 于 在 系统 内 部 标识 各 规范 的 项 式 。 简 单 起 见 ， 此 处 采用 的 是 模 
块 名 ， 即 原子 tr_server。 

国 第 二 项 start， 二 -个 用 于 启动 进程 的 三 元 组 {Module， FuUuNnCtion, Arguments}.。 与 
调用 内 置 函 数 spawn/3 时 一 样 ， 其 中 第 一 个 元 系 是 模块 名 ， 第 二 个 元 系 是 函数 名 ， 第 二 
个 元 素 是 也 数 的 调用 参数 列表 。 在 这 个 例子 中 , 监督 者 应 调用 tr_server:start_link() 
来 启动 子 进 程 (也 就 是 tr_server )。 

口 第 三 个 元 素 Restart, 用 于 指明 子 进程 发 生 故 障 时 是 否 需 要 重启 。 此 处 指定 为 permanent， 
因为 你 搭建 的 是 需要 长 期 运行 的 服务 ,无论 出 于 任何 原因 导致 进 程 终 止 都 应 重启 进程 。 
( 该 选项 还 可 取 值 为 表示 永 不 重启 进程 的 temporary, 以 及 仅 在 进程 意外 终止 时 重启 进程 
的 transient。) 

口 第 四 个 元 素 Shutdown， 用 于 指明 如 何 终止 进程 。 此 处 取 值 为 一 个 整数 〈《2000 )， 表 示 终 
止 进程 时 应 采用 软 关 闭 策 略 ， 给 进程 留 出 一 段 目 我 了 靳 的 时 间 ( 以 坚 秒 为 单位 )， 如 末 进 
程 未 能 在 指定 时 间 内 自行 退出 ， 将 被 无 条 件 终止 。 该 选项 还 可 取 值 为 brutal_kil1， 表 
示 在 关闭 监督 进程 时 立即 终止 子 进程 ; 以 及 infinity， 主 要 用 于 子 进程 本 身 也 同 为 监督 
者 的 情况 ， 表 示 应 给 予 子 进 程 充分 的 时 间 目 行 退出 。 
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口 第 五 个 信 Type,， 用 于 表示 进程 是 监督 者 (supervisor ) 还 是 工作 者 (worker )。 在 整个 
监督 树 中 ， 除 了 实现 了 supervisozr 行 为 模式 的 监督 者 进程 以 外 ， 剩 下 的 都 是 工作 进程 。 
随 着 应 用 的 复杂 度 的 提升 ， 你 可 以 按 自 己 的 喜好 组 织 监督 进程 进而 形成 层级 结构 ， 以 提 
供 更 细 粒 度 的 控制 (参见 图 4-2 )。 监 督 者 可 以 通过 mype 字 段 识 别 子 进程 是 否 同 为 监督 者 。 
显然 此 处 的 服务 需 进 程 是 工作 进程 。 
口 第 六 个 选项 列 出 了 该 进程 所 依赖 的 模块 。 这 部 分 信息 仅 用 于 在 代码 热 升级 时 告知 系统 该 
以 何 种 顺序 升级 各 个 模块 。 一 般 来 说 ， 只 需 列 出 子 进程 的 主 模 块 ， 在 这 里 就 是 tr server。 
内 容 还 真 不 少 ; 不 过 谢 天 谢 地 ， 只 要 做 上 一 次 , 下 次 创建 监督 者 的 时 候 就 有 模板 可 依 了 。 今 
后 要 是 想 不 起 来 该 怎么 写 子 进程 规范 , 你 可 以 随时 查阅 上 述 内容 。 子 进程 规范 的 优点 在 于 仅 需 短 
短 两 行 代码 便 可 实现 大 量 功能 。 
搞定 了 这 些 , 就 完工 了 ! 这 两 个 小 模块 费 了 我 们 不 少 口舌 , 但 现在 你 已 经 逾越 了 最 大 的 障碍 。 
至 此 ， 我 们 希望 你 能 够 对 全 局 有 一 个 清晰 的 把 握 ， 并 明确 认识 这 些 内 容 之 间 的 关系 和 作用 。 


4.3 ”启动 应 用 


你 的 应 用 已 经 完工 了 : 目录 绪 构 建立 完毕 ， 元 数据 就 绪 ， 应 用 局 动人 口 编写 完成 ,， 根 监督 者 
也 已 经 实现 。 来 运行 你 的 第 一 个 OTP 应 用 吧 。 

首先 你 得 编译 src 目 录 下 的 所 有 代码 ， 从 而 在 ebin 目 录 下 生成 对 应 的 .beam 文 件 。 如 果 系 统 设 
置 无 误 ，erlc 应 位 于 搜索 路 径 内 ， 假 定 当 前 路 径 已 经 设置 为 应 用 根 目 录 tcp rpc， 那 么 你 可 以 使 
用 以 下 命令 来 完成 这 个 任务 : 

$ erlc -o ebin src/*.erl 
( 有关 erlc 的 使 用 请 参见 2.3.6 闻 。) 你 也 可 以 将 src 目 录 设 为 当前 目录 ， 然 后 用 Erlang shell 编 译 所 
有 模块 ， 再 将 .beam 文 件 手工 移入 ebin 目 录 ; 不 过 现在 你 也 该 学 着 用 用 er1lc 了 (配合 某 种 构建 工 
具 一 起 使 用 效果 更 佳 ， 例 如 Make、Cons、SCons 或 Rake， 不 过 这 已 经 超出 了 本 书 的 讨论 范畴 )。 

-beam 文件 就 位 后 ， 局 动 Erlang 并 将 ebin 目 录 纳 入 代码 路 径 ， 如 下 : 

§ erl _pa ebin 

( -pa 是 path add 的 缩写 ， 用 于 添加 单个 目录 到 代码 路 径 的 最 前 方 。) 在 Windows 上 ， 请 换 用 
wer1， 人 参见 2.1.1 节 。 

Erlang shell 启 动 后 ， 只 需 一 个 命令 便 可 启动 应 用 : 以 应 用 名 tcp_rpc 为 参数 调用 标准 库 函 数 
application:start/1， 如 下 : 


Eshell V5.5.5 (abort with ^G) 
1 applicatlion stoart (tap rec). 
Ok 


看 来 局 动 顺利 。 没 什么 好 奇怪 的 一 一 毕竟 你 已 经 按部就班 地 完成 了 本 书 布置 的 所 有 任务 。 为 了 证 
明 应 用 确实 已 经 启动 且 运 转正 常 ， 不 妨 用 3.3 市 中 介绍 的 方法 值 助 Telnet 测 试 一 下 。 
你 可 能 会 奇怪 shell 是 怎么 找到 各 个 模块 的 , 你 让 它 局 动 tcp_rpc 应 用 , 但 实际 上 根本 没有 叫 
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这 个 名 字 的 模块 。 还 记得 .app 文 件 吧 (代码 清单 4-1 ) ”正如 Erlang 会 在 代码 路 径 中 搜索 .beam 文 件 
来 加 载 模块 ，application:start/1L 困 数 也 会 在 代码 路 径 中 搜索 ,app 文件。 由 于 ebin 目 录 已 经 
位 于 代码 路 径 之 中 ，shell 便 可 以 顺利 找到 元 数据 文件 ebin/tcp_rpc.app， 该 文件 包含 了 所 需 的 一 切 
信息 一 一 尤其 是 该 用 哪个 模块 (tr_app ) 来 司 用 整个 应 用 。 

你 的 第 一 个 OTP 应 用 就 此 大 功 告 成 ! 并 没 那么 难 ， 对 吧 ? 这 个 主题 结束 之 前 ， 还 有 最 后 一 件 
事 要 做 : 文档 生成 。 


4.4 生成 EDoc 文档 


在 3.2.2 市 中 ， 我 们 解释 了 如 何 用 EDoc 注 释 来 标注 代码 从 而 直接 从 源码 中 生成 文档 。 如 今 你 
的 应 用 已 经 定义 完毕 ， 文 档 生成 束 是 小 末 一 原 了 。 局 动 erl 后 ， 在 Erlang shell 中 执行 下 述 命令 : 


2> edoc:application(tcp rpcec, ".", [1]}). 
ok 


现在 ， 你 可 以 用 浏览 妖 打 开 doc/index.html 文 件 来 检验 生成 的 结果 。 你 会 发 现在 doc 下 还 生成 了 一 
堆 其 他 的 文件 ， 但 它们 都 可 以 通过 index.html 访 问 。 

请 注意 ， 即 便 源码 中 没有 任何 EDoc 标 注 也 没关系 。 这 种 情况 下 生成 的 文档 只 包含 一 些 基本 
信息 ， 可 用 于 展示 应 用 中 包含 哪些 模块 ， 每 个 模块 又 分 别 导 出 了 哪些 函数 ， 即 便 如 此 ， 也 比 什么 
都 没有 要 强 多 了 。 

空 表 [] 是 传 给 EDoc 的 额外 选项 〈 目前 还 不 需要 )， 句 点 〈.) 则 表示 应 用 就 位 于 当前 目录 下 。 
此 处 应 用 的 位 置信 息 是 必需 的 , 通过 -pa 选项 传人 的 相对 路 径 sbin 无 法 给 系统 提供 足够 的 线索 来 
定位 应 用 。 但 如 有 果 退 出 Erlang shell， 将 当前 目录 提 到 应 用 目录 的 上 一 层 ， 青 像 这 样 启动 Erlang 

$ erl -pa tcp rpc/ebin 
这 时 你 便 可 以 采用 先前 调用 的 图 数 的 一 个 简化 版 本 来 达到 同样 的 目的 : 

Eshell V5.5.5 (abort with ^G) 


1> edoc:application(tcp_rpc). 
OK 


现在 系统 能 够 自行 推算 出 与 tcp_rpc 这 个 应 用 名 相关 联 的 路 径 了 。( 详情 参见 标准 库 函 数 
code:1ib_qir/1。) 请 注意 ， 即 便 目录 名 中 含有 版 本 号， 这 个 方法 也 行 得 通 ( 参见 图 4-1 ),。 一 
般 来 说 ， 代 人 码 路 径 主 要 由 系统 中 所 有 已 安 窑 应 用 的 ebin 上 日 录 的 绝对 路 径 组 成 ; 应 用 的 三 位 版 本 号 
则 主要 用 于 构建 脚本 中 。 

现在 你 已 经 得 到 了 一 个 完整 、 可 运作 的 应 用 , 配 有 一 些 基本 的 文档 , 在 此 基础 之 上 你 还 可 以 
通过 诡 加 EDoc 注 释 来 进一步 完善 文档 。 这 一 章 可 以 圆满 结束 了 ! 



























































4.5 小结 


在 这 一 章 中 ,我 们 学 习 了 OTP 应 用 的 基础 知识 ， 了 解 了 它们 的 结构 ， 以 及 如 何 把 代码 包 效 成 
五 脏 俱 全 的 应 用 。 我 们 而 望 你 能 又 随 相关 材料 切实 实践 所 有 的 示例 ， 至 少 也 应 该 按 第 3 草 起 始 处 
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的 说 明 下 载 相关 源码 ， 并 编 详 执行 。 

芝 循 这 些 结构 并 以 工业 级 的 OTP 库 为 基础 来 构建 代码 , 可 以 令 系统 的 基本 容错 能 力 提 高 一 个 
数量 级 ， 并 且 有 助 于 开发 一 怪 、 可 靠 且 易于 理解 的 软件 。 在 第 10 章 ， 我 们 将 讨论 男 一 类 软件 包 ， 
称 为 发 布 镜 像 。 发 布 镜 像 用 于 将 数 个 应 用 聚合 成 一 佟 完整 的 Erlang 软 件 服 务 。 到 那 时 ， 你 将 了 解 
局 动 完 整 Erlang 系 统 的 方法 ; 你 也 将 明 日 为 何 早先 介绍 的 通过 调用 application . start/1 来 房 
动 应 用 的 方法 只 适用 于 手工 测试 ， 而 不 适用 于 产品 系统 。 

也 就 是 说 ,看 完 前 面 两 章 ， 你 便 已 经 问 创 建 产 品级 质量 的 Erlang/OTP 软 件 迈 出 了 最 重要 的 一 
步 。 在 继续 讨论 本 书 第 二 部 分 中 有 关 如 何 构建 工业 级 Erlang 服 务 的 主题 之 前 ， 我 们 先 稍 作 休整 。 
在 下 一 章 ， 我 们 将 回 你 展示 一 些 用 于 可 视 化 观察 Erlang 系 统 内 部 情况 的 标准 实用 工具 。 
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本 章 概要 

口 用 Appmon 和 WebAppmon 监 控 应 用 
口 用 Pman 管 理 进 程 

口 源码 级 调试 硕 的 使 用 

口 用 表 查 看 硕 检查 数据 表 

口 使 用 Erlang 工 具 栏 





截至 目前 为 止 ， 你 已 经 学 习 了 大 量 有 关 Erlang 和 OTP 的 知识 。 我 们 在 上 一 章 介 绍 了 OTP 应 用 
和 监督 者 ， 并 探讨 了 它们 在 Erlang 系 统 中 的 工作 方式 。 在 本 章 中 ， 我 们 将 回 你 展示 Erlang 提 供 的 
右 干 个 用 于 检视 运行 时 系统 的 图 形 化 工具 , 这 些 工 具 可 以 很 好 地 帮助 我 们 增进 对 系统 的 理解 。 借 
助 这 些 工 具 , 我 们 可 以 很 好 地 以 图 形 化 方式 观察 进程 、 应 用 和 监督 层级 。 我 们 介绍 的 第 一 个 工具 
叫 作 Appmon， 是 从 应 用 和 监督 者 的 角度 来 观察 系统 的 专用 工具 。 

















5.1 Appmon 





顾名思义 ，Appmon 是 用 来 监视 OTP 应 用 的 工具 。 它 既 可 以 按 图 形 化 方式 展示 系统 中 当前 
正在 运行 的 应 用 及 其 监督 结构 ;可 以 查看 进程 的 当前 状态 ; 还 可 以 针对 这 些 进程 执行 一 些 基本 
操作 。 





5.1.1 Appmon GUI 


进一步 说 明之 前 ， 我 们 先 启 动 Appmon。 打 开 Erlang shell 并 执行 appmon: start (): 


Eshell V5.7.4 (abort with 人 ^G) 
1> appmon:startt(). 


稻 后 , 便 会 弹出 一 个 类 似 图 5-1 的 窗口 。 这 就 是 Appmon 的 主 徐 口 ， 其 中 显示 了 系统 中 正在 运 
行 着 的 所 有 应 用 ， 现 在 这 里 仅 有 kernel 应 用 。 窗 口 左 侧 的 指示 条 显示 了 整个 系统 的 当前 负载 。 

窗口 项 部 有 一 排 染 单 ， 你 可 以 通过 File 蘑 单 中 的 菜单 项 退出 Appmon， 或 关闭 窗口 。 在 File 羔 
单 中 还 有 一 个 末 单 项 Show List Box, 通过 它 可 以 打开 为 一 个 和 窗口， 系统 中 的 所 有 应 用 会 以 更 精 俐 
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的 方式 在 那里 列 出 。 当 系统 中 有 许多 应 用 运行 时 ， 主 窗口 中 会 挤 作 一 团 , 用 这 个 窗口 可 以 更 便捷 
地 选择 应 用 。 


QANANO IN APPMON: Overview on nonode@nohost 


File Actions Options Nodes Help | 
1 











kernel | 








图 $-1 Appmon 的 主 窗 口 。 左 侧 是 系统 负载 指示 条 ( 当前 为 零 ) 。Erlang 系 统 默认 只 会 


本 5 


Actions 菜 单 中 的 菜单 项 可 用 于 重启 Erlang 系 统 ( 停止 并 清理 所 有 应 用 ,然后 再 重新 启动 这 些 
应 用 )， 重 新 引导 整个 Erlang 系 统 ( 重启 Erlang 虚 拟 机 一 一 为 此 你 必须 先 配 置 心跳 命令 )， 或 停止 
Erlang 系 统 。 这 里 还 有 一 个 名 为 Ping 的 荣 单 项 , 用 于 在 分 布 式 环 境 下 重建 断 开 的 连接 。( 我 们 将 在 
第 8 章 讨论 分 布 式 Erlang。) 

你 可 以 通过 Options 亲 单 选 择 系统 负载 的 计算 方式 : 按 CPU 时 间 计 算 负 和 载 , 或 按 CPU 等 千 队 列 
中 的 进程 个 数 计算 负载 。 在 分 布 式 Erlang 系 统 中 ， 你 还 可 以 选择 节点 的 显示 方式 ， 只 用 一 个 窗口 
每 次 只 显示 一 个 市 点 ， 或 是 同时 用 多 个 窗口 分 别 显 示 所 有 市 点 。Nodes 末 单 中 列 出 的 是 已 知 的 所 
有 可 用 节点 : 当前 仅 有 nonodeenohost ， 即 正在 以 非 分 布 式 方式 运行 着 的 本 地 系统 。 等 到 学 完 
第 8 草 ， 你 就 会 明日 这 些 问 题 。 现 在 你 只 需要 记 住 ， 你 可 以 便捷 地 观察 和 控制 在 网 络 中 不 同 机 种 
上 运行 着 的 应 用 。 我 们 这 里 不 妨 启 动 一 个 大 家 熟悉 的 应 用 ， 例 如 上 一 革 创 建 的 tcp_rpc 应 用 。 我 们 
这 里 按照 4.3 节 的 步骤 局 动 它 。 应 用 局 动 完 毕 后 ，Appmon 主 窗口 中 的 kernel 应 用 劳 边 便 会 显示 出 
tcp_rpc， 如 图 5-2 所 示 。 

















I\, APPMON: Overview on nonode@nohost 


QO0 
File Actions Options Nodes Help | 
1 





kernel | tcp_rpc | 

















图 $-2 ”启动 tcp_rpc 应 用 后 的 Appmon 主 窗口。 点 击 应 用 名 称 可 以 看 到 应 用 的 更 多 细 市 
每 个 应 用 名 都 是 一 个 按钮 ， 点 击 后 会 打开 一 个 显示 应 用 信息 的 独立 窗口 。 现 在 我 们 单 击 
tcp_rpc 按 钮 。 新 窗口 中 显示 的 正 是 tcp_rpc 应 用 的 监督 结构 ， 如 网 $-3 所 示 。 你 可 能 得 拉 伸 一 下 窗 
口才 能 看 全 所 有 内 容 。 
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图 $-3 ”Appmon 应 用 和 窗口， 其 中 展现 的 是 tcp rpc 应 用 的 监督 结构 。 窗 口中 的 按钮 
用 于 选 定 想 要 执行 的 动作 : Info 、Send、Trace 或 Kill 


最 上 方 的 两 个 神秘 的 匿名 进程 就 是 应 用 主 进程 。 它 们 是 application 行 为 模式 容器 的 一 部 
分 , 由 系统 在 应 用 启动 时 派生 而 来 。 你 无 须 关 心 它 们 ， 只 需要 知道 它们 会 调用 你 的 应 用 行为 模式 
的 start 浮 数 ， 在 这 个 例子 里 就 是 tr_app:start/2 (参见 4.1.3 节 )。 相 应 地 ， 当 应 用 关闭 时 ， 
它们 会 在 其 他 进程 全 部 终止 后 调用 tr_ app:stop/1。 

从 上 往 下 数 , 第 三 个 进程 就 比较 有 意思 了 : 它 就 是 你 用 tr_sup:start_link() 启 动 起 来 的 
根 监 督 者 进程 (参见 代码 清单 4-3 )。 你 会 看 到 它 有 一 个 名 为 tr_server 的 子 进 程 ， 这 正 是 由 
tr_sup:init/1 指 定 的 子 进 程 规范 中 的 名 字 。 

应 用 窗口 的 项 部 有 一 排 按 钮 。 它 们 用 于 控制 点 击 徐 口中 各 进程 后 应 该 触发 什么 动作 。 首 先 
点 击 按钮 选 定 一 个 动作 模式 ( 默认 模式 为 Info )， 然后 再 点 击 目标 进程 。 选 定 Info 后 点 击 tr_server 
进程 : 这 样 将 会 打开 一 个 如 图 5-4 的 新 窗口 ， 其 中 显示 了 许多 和 该 进程 当前 执行 状态 相关 的 详细 


信息 。 





ode: nonode@Nnohost, Process: <0.54.0> 

[{registered name, tr_server}, 

{current function, {prin inet,accept9,2}}， 

{initial_ call, {proc_lib,init p,5}}, 

{status,waiting}, 

{message_queue_ len,0}, 

{messages, []}, 

{links, [<O.53.0>,#Port<0,2505>]}, 

{dictionary, [{'$ancestors', [tr_sup, <0.52.0>]}, 
{'$initial_ call’ ST Er te init,1}}]}, 

{trap_exit, false}, 

{error_handler, error_handler}, 

{priority, normal}, 

{group_leader, <0.51.0>}, 


{total_heap_size, 233}, 

{heap_size, 233}, 

{stack_ size, 16}, 

{reductions, 135}, 

{garbage collection, [{fullsweep_after, 65535}, {minor_gcs,0}]}, 
{suspending, []}] 











图 5-4 Appmon 进 程 信息 窗口 。 它 用 于 展现 特定 进程 的 细节 信息 ， 诸 如 消息 队列 的 
长 度 、 内 存 使 用 量 以 及 当前 正在 执行 的 函数 
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其 中 消息 队列 长 度 、 内 存 使 用 量 以 及 该 进程 当前 正在 执行 的 函数 等 信息 经 常会 在 调试 过 程 中 
用 到 。 点 击 Send 按 钮 后 再 点 击 某 个 进程 ,会 弹出 一 个 小 窗口 , 通过 该 窗口 你 可 以 癌 选 中 的 进程 发 
送 任意 Erlang 项 式 〈《 参 见 图 $-5 )。 你 在 此 处 输入 的 任何 项 式 都 会 被 发 送 至 该 进程 。 


QAONO Xj Send 






To: [<0.54.0> Ok | 
vsg cnce! | 


py 





图 5-5 ”Appmon 应 用 窗口 中 的 Send 动 作 可 用 于 癌 进 程 发 送 任 意 消息 。 在 调试 时 Send 可 
用 于 检查 进程 的 反应 是 否 正 常 ; 在 出 现 因 等 待 消息 而 受阻 的 进程 时 还 可 用 于 解 
除 进 程 阻塞 
下 一 个 动作 按钮 是 Trace。 利 用 它 可 以 跟踪 你 后 续 点 选 的 进程 。 该 动作 没有 什么 立 件 见 影 的 
效 采 , 但 它 会 在 后 台 针 对 选中 的 进程 司 用 跟踪 。 有 关 进 程 跟踪 设施 的 详情 请 参考 Erlang/OTP 人 官方 
文档 ， 既 包括 由 erlang:trace/3 提 供 的 底层 API， 以 及 runtime tools 应 用 中 的 abg 模 块 所 提供 的 
更 为 友好 的 用 户 接口 。 关 于 runtime tools 请 参考 文档 中 的 工具 章节 。 在 $.2 节 中 讨论 Pman 工 具 时 ， 
我 们 还 会 回 过 头 来 讨论 进程 跟 踩 。 
最 后 一 个 动作 是 Kill。 该 动作 会 回 你 点 选 的 进程 发 送 一 个 不 可 捕获 的 ki11 信 号 。 你 可 以 先 点 
选 Ki 再 点 选 tr_sup 进 程 来 测试 一 下 效果 。 测 试 的 结果 应 该 是 tcp_rpc 应 用 的 所 有 进程 消失 列 尽 ,只 
留 下 一 个 空 日 窗口 。( 回想 一 下 我 们 曾经 讨论 过 的 进程 链接 、OTP 监 督 者 以 及 1.2 节 中 提 到 的 目 动 
清理 机 制 一 一 由 于 进程 之 间 的 链接 方式 ， 终 止 根 监督 者 会 导致 整个 应 用 终止 。) 




















5.1.2 WebTool 版 Appmon 


如 果 乐 意 ( 或 者 你 的 机 右上 压根 儿 就 没有 图 形 环 境 ), 你 可 以 以 另外 一 种 方式 来 使 用 Appmon 
通过 WebTool 应 用 。 在 Erlang shell 下 调用 webtool:start()， 你 将 会 看 到 如 下 输出 : 


2> webtool:start()}). 

WebTool is available at http://localhost:8888/ 
Or http://127.0.0.1:8888/ 

{ok,<0.62.0>} 


接着 ， 请 打开 浏览 如 并 访问 http://localhost:8888/( 如 果 是 在 其 他 机 妖 上 执行 ， 请 换 用 对 应 的 
机 知名 或 IP 地 址 )。 这 将 打开 WebTool 的 欢迎 页 面 ， 在 此 你 可 以 启动 多 种 工具 。 其 中 一 个 就 是 
WebAppmon， 它 的 界面 跟 上 一 方 中 的 GUI 类 似 ， 只 不 过 需要 通过 浏览 厚 来 呈现 。 

即便 待 监视 的 系统 上 没有 安 狼 Appmon 应 用 ( 比如 仪 配 备 了 最 小 Erlang 环 境 的 和 豚 入 式 系 统 )， 
你 也 可 以 使 用 WebTool 版 Appmon。 当 前 ，WebTool 版 本 还 不 支持 停止 应 用 或 终止 进程 。 

可 以 说 ， Erlang 的 各 种 图 形 化 工具 各 有 不 同 的 全 局 视角 。 其 中 Appmon 以 应 用 为 出 发 点 。 我 们 
接 下 来 要 考察 的 工具 名 为 Pman， 它 的 关注 点 只 限于 进程 ， 而 对 应 用 一 无 所 知 。 




















图 灵 社 区 会 员 for(;;)(13433955876@163.com) 专 享 尊重 版 权 





5.2 Pman 


Pman 是 process manager 的 简称 ， 这 个 工具 从 进程 的 角度 来 观察 Erlang 世 界 。 它 可 以 为 你 展示 
系统 中 当前 运行 者 的 所 有 进程 并 且 人 允许 你 对 这 些 进 程 执行 各 种 操作 。 

让 我 们 重新 启动 一 个 新 的 Erlang 系 统 并 像 上 一 节 那 样 启动 tcp_rpc 应 用 。 接 下 来 ,输入 
pman :staxrt() 局 动 Pman 必 用 : 


Eshell V5.7.4 {abort with 人 ^G} 
1> application:start (tcp _ rpc}). 
ok 

2> pman: start{}. 

<0O.42.0> 

3> 


Pman 启 动 后 ， 你 将 会 看 到 一 个 如 图 5-6 所 示 的 窗口 。 窗 口中 列 出 的 是 当前 运行 的 进程 ， 同 时 
还 显示 了 进程 相关 的 一 些 信息 ， 如 进程 是 否 经 过 注册 、 信 箱 中 的 消息 数目 ,以 及 内 存 占 用 量 的 估 
算 值 (以 机 器 字 长 而 非 字 节 为 单位 ) 等 。 其 中 Reds 一 列 显 示 的 是 每 个 进程 的 规约 (reduction ) 次 
数 ， 它 大 致 反映 了 进程 占用 的 CPU 时 间 。 
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am 





国 Hide System Processes 国 Auto-Hide New 夫 Hidden: 0 





图 5-6 “显示 Erlang 系 统 中 所 有 进程 的 Pman 主 窗口 ， 其 中 还 包括 注册 名 、 消 息 队 列 长 度 
和 内 存 占 用 量 ( 以 字 长 为 单位 ) 等 基本 信息 
你 会 看 到 列表 中 的 进程 数量 颇 多 。 那 是 因为 所 有 进程 全 都 罗列 在 了 你 的 眼前 ,其 中 也 包括 正 
党 Erlang 环境 中 的 各 个 系统 进程 。 通 常情 况 下 ， 你 只 需 关 心 由 有 目 己 启动 的 应 用 中 的 进程 。 要 精简 
进程 列表 ， 请 勾 选 位 于 窗口 左下 角 的 Hide System Processes 复 选 框 。 图 5-7 显 示 的 是 隐藏 系统 进程 
后 留 下 的 你 所 关心 的 那些 进程 。 特 别 是 tr sup 和 tr server 进 程 。 请 跟 图 5-3 中 的 视图 对 比 一 下 一 一 
在 此 你 是 看 不 出 二 者 之 间 的 联系 的 。 
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(AONS Pman: Overview on nonode@nohost 
File View | Trace | Nodes Help 


prim_iner accepro72 wever hh 
es wp hl 
sandarderorsever onl |sandarderor | | jp 

sandaroenorsup | 0 he 


gen_server:loop/6 standard_error_sup 





M Hide System Processes | Auto-Hide New # Hidden: 32 


图 $-7 ”隐藏 了 系统 进程 的 Pman 主 和 窗口。 这 个 列表 更 易于 管理 。 点 选 View 荣 单 中 的 
Hide Selected Process 选 项 可 以 进一步 精简 这 个 列表 


请 看 第 二 行 ( 注 册 名 为 {r_sup 的 进程 )。 最 后 一 次 观测 该 进程 时 ,， 它 正 执行 到 哪儿 呢 ? Current 
Function 一 列 指示 是 在 gen_server:1oop/6。 可 是 ， 这 并 不 像 你 写 的 tr_sup 监 督 者 的 代码 呀 ! 怎 
么 回 事 儿 呢 ? 是 这 样 的 ， 程 序 的 这 个 位 置 位 于 我 们 在 3.1.2 节 介绍 过 的 行为 模式 容 需 之 中 。4.2 贡 
中 介绍 的 tr_sup 模 块 是 supervisor 行 为 模式 的 一 个 实现 ， 而 supervisor 行 为 模式 本 里 义 基于 
gen_server 行 为 模式 。 通 常情 况 下 ， 基 于 gen_server 的 进程 在 无 事 可 做 时 会 阻塞 在 gen server 
模块 的 主 循环 上 ,， 等待 着 下 一 条 消息 的 来 临 。 在 调试 时 一 定 要 说 记 这 一 点 : 进程 当前 正在 执行 的 
国 数 往往 位 于 通用 框架 代码 之 中 ， 因 此 在 很 多 情况 下 ， 进 程 的 注册 名 更 有 助 于 辨别 进程 。 

通过 File 菜 单 ， 你 可 以 退出 Pman 或 设置 跟踪 选项 。 和 Appmon 一 样 ，Pman 也 有 一 个 用 于 
分 布 式 Erlang 的 Nodes 末 单 。Trace 有 末 单 则 用 于 启动 进程 跟 踊 ， 其 中 还 包含 强制 终止 进程 的 采 
单项 。 

目前 所 有 沫 单 中 最 有 用 的 一 项 就 是 View 沫 单 了 。 通 过 它 你 可 以 更 为 细致 地 锋 选 要 查看 的 进 
程 ， 还 可 以 用 它 刷 新 窗口 中 的 信息 。 算 选 进程 的 方式 有 很 多 ， 你 可 以 一 上 来 就 隐藏 所 有 的 进程 
再 逐个 儿 把 要 显示 的 进程 挑 出 来 ， 也 可 以 先 一 次 性 把 所 有 进程 都 显示 出 来 再 把 不 需要 的 那些 隐 
藏 挥 。 你 还 可 以 根据 进程 当前 执行 的 模块 来 隐藏 进程 ， 或 者 在 新 窗口 中 显示 进程 所 处 的 模块 的 
言 息 。 

双击 列表 中 的 进程 或 者 选择 Trace 一 Trace Selected Process 采 单项 ， 会 弹出 所 选 进程 的 跟 踩 窗 
口 。 该 窗口 会 先 显 示 一 些 基 本 信息 ， 然 后 根据 当前 选项 设置 开始 跟踪 该 进程 。 图 5-8 展 示 的 是 经 
由 File 一 Options 打 开 的 默认 跟踪 选项 的 设置 窗口 。 在 打开 的 各 个 跟踪 窗口 中 也 可 以 单独 控制 这 些 
选项 。 
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WAM I\ DefaultTrace Options 


Trace output options: Inheritance options: 


图 Trace send 图 Inherit on spawn 
三 AI| spawns 
看 First spawn only 


图 Trace receive 
加 Trace functions 
加 Trace events 


加 Inherit on link 
将 All links 
闭 First link only 





Trace output options: 


茵 In window 


鞍 To file Ti | 


OK | Cancel | 











图 5-8 ”Pman 的 默认 跟踪 选项 设置 。 你 可 以 选择 要 跟踪 的 动作 并 决定 是 否 跟 踊 由 当前 
进程 新 派生 出 来 或 链接 上 的 进程 。 你 还 可 以 将 跟踪 结果 转 储 至 文件 中 


其 中 ，Trace Output 区 的 选项 尤为 重要 。 你 可 以 在 此 决定 是 否 打算 查看 消息 收发 、 国 数 调 用 
以 及 其 他 各 种 事件 ， 如 进程 的 派生 、 链 接 、 终 止 等 。 你 可 以 指定 如 何 处 理 当 前 跟踪 进程 新 派生 出 
来 (或 新 链接 上 ) 的 其 他 进程 ， 此 外 ， 你 还 可 以 选择 将 跟踪 结果 转 储 到 文件 而 不 是 GUI 窗 口 。 

提醒 : 如 果 被 跟踪 的 进程 任务 索 重 ， 系 统 执行 跟踪 的 消耗 会 很 高 。 尤 其 不 要 跟踪 用 于 显示 跟 
踩 结 果 的 那个 系统 进程 。 否 则 ， 正 如 一 个 企图 记录 目 身 行为 的 日 志 系 统 ,， 它 很 快 就 会 被 目 己 产生 
的 海量 信息 淹没 , 并 最 终 导 人 致 系统 因 内 存 耗 尽 而 月 沉 。 千 万 不 要 在 产品 环境 上 胡乱 双击 列表 中 的 
系统 进程 。( 在 这儿 丈 无 所 谓 了 。 ) 

对 于 这 个 例子 ,请 一 边 尝 试用 3.3 节 的 方法 用 Telnet 和 服务 胡 交 互 ， 一 边 针 对 tr _ server 和 tr sup 
进行 一 些 人 简单 的 跟踪 。 人 然后 再 在 跟踪 tr sup 进程 的 同时 用 主 窗口 Trace 琳 单 中 的 K 记 动作 强制 终止 
tr_server 进 程 ， 观 察 子 进程 消亡 时 监督 者 的 反应 。 和 跟踪 相关 的 内 容 还 有 很 多 ， 不 过 仪 就 了 解 其 
工作 方式 而 言 ， 这 些 已 经 足够 了 。 

规 至 目前 为 止 ， 你 已 经 学 会 了 用 Appmon 来 观察 应 用 以 及 用 Pman 来 观 罕 进程。 下面， 我 们 将 
用 Debugger 来 观察 模块 。 




















5.3 ”调试 再 


图 形 化 的 源码 级 调试 融 仍 然 是 至 天 重要 的 开发 工具 之 一 ， 不 过 跟 其 他 语言 相 比 ， 开 发 Erlang 
程序 时 很 少 会 用 到 调试 带 。 原因 一 方面 在 于 你 掌握 着 更 多 信息 来 源 , 比如 日 志和 有 谣 省 报告 。Erlang 
源码 往往 又 非常 清晰 ( 且 没 有 副作用 )， 只 要 有 月 演 报 告 在 手 ， 通 党 立即 就 能 定位 错误 。 为 一 方 
面 ， 如 果 骨 尝 报 告 还 不 足以 定位 错误 ,那么 问题 多 半 与 复杂 的 多 进程 通信 、 时 厅 、 网 络 和 系统 负 
载 等 因素 脱 不 开 干 系 。 在 这 些 情况 下 ,你 需要 的 是 民 好 的 日 志 ,， 这 类 问题 要 么 无 法 在 图 形 调试 胡 
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里 重 现 ， 要 么 由 于 时 序 的 变化 而 导致 线索 尽 失 。 
不 过 有 的 时 候 仍 然 有 对 代码 进行 单 步 跟 踪 的 必要 一 一 比如 开发 复杂 算法 或 协议 时 。 在 Erlang 
shell 中 调用 aebugger :statrt() 即 可 局 动 调试 句 : 


EShell V5.7.4 (abort with ^G) 
1> debugger:start!{(). 
{ok,<0.46.0>} 

2> 


该 操作 将 打开 主 调 试 带 窗口 ， 如 图 $-9 所 示 。 不 过 这 慌 人 跟 你 所 预期 的 调试 名 不 大 一 样 。 


beam.smp File Edit Module Process Break Options Windows Window Help 
Monitor 





Initial Call 


Auto Attach: 


LFirst Call 
| On Break 
| On Exit 


Stack Trace: 

On (with tail) 

Back Trace Size: 
0 








图 5$-9 ”源码 级 调试 带 启 动 后 的 主 监视 窗口 。 右 侧 的 大 族 区 域 用 于 显示 运行 在 调试 大 下 
的 进程 ， 左 侧 较 小 的 区 域 用 于 显示 正 被 解释 执行 的 模块 


它 跟 你 所 见 过 的 DDD 、Eclipse 及 其 他 上 百 种 调试 器 都 不 一 样 。 原 因 有 二 ,首先 ，Erlang 采 用 
的 织 构 很 可 能 近 异 于 你 之 前 所 加 悉 的 织 构 , 它 是 面 回 进程 的 一 一 即便 是 调试 希 也 是 如 此 : 窗口 中 
的 大 上 空白 区 域 用 于 显示 当前 连接 上 调试 名 的 进程 。 其 次 , 在 你 明确 选择 一 个 模块 前 它 在 调试 硕 
中 是 不 可 见 的 : 左 侧 的 一 小 块 区 域 用 于 显示 当前 选中 的 模块 。 

要 在 调试 大 中 司 用 某 个 模块 ， 你 必须 先 让 调试 大 解释 该 模块 。 这 里 涉及 两 部 分 内 容 : 调试 带 
既 需 要 .erl 源 文件 (这样 它 才 能 显示 源码 )， 也 需要 对 应 的 包含 调试 信息 的 .beam 文 件 。 你 需要 在 
编译 时 用 aebug_info 标 志明 确 告知 编译 器 在 .beam 文 件 中 加 上 调试 信息 。 让 我 们 重复 4.3 节 中 的 
步骤 重新 编译 tcp_ rpc 的 代码 ， 这 次 记得 加 上 这 个 标志 。( 这 个 标志 应 该 直接 传 给 编译 锅 ， 将 它 传 
给 erlc 时 应 该 以 + 而 非 -为 前 级 。) 

$ erlc +debug info -0o ebin src/*.erl 

点 选 Module 一 Interpret 打 开 文 件 选择 对 话 框 并 点 选 一 个 源码 文件 。 调 试 锅 会 目 动 从 源 文 件 所 
在 的 目录 中 或 邻近 的 ebin 目 录 中 找到 对 应 的 .beam 文 件 。 在 这 个 例子 中 , 请 找到 tr_ servererl 文 件 并 
选中 它 。 这 样 便 可 以 在 主 调试 需 窗 口 的 模块 列表 中 看 到 tr_server。 双 击 列 表 中 的 名 字 可 以 打开 一 
个 用 于 查看 模块 源码 的 新 窗口 ， 如 图 5-10 所 示 。 
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2 pa 
126  %% aspec handle_info(Info, State) -> {noreply, State} | 

.7% {noreply, State, Tinmeout} | 

128 %% {stop, Reason, State} 

129 x% Bend 

130 XN%------ 

131 handle_infoC{tcp, Socket, RowData}, State) -> 

132 RequestCount = State#state.request_count, 

133 try 

134 {M, F, A} = split_out_mfa(RawData), 

135 Result = apply(M, F, A), 

136 gen_tcp:send(CSocket, io_lib:fwrite("~p~n", [Result])) 

137 catch 

138 _C:E -> 

139 gen_tcp:send(Socket, io_lib:fwrite("~p~n", [EJ])) 

140 end, 

141 {noreply, State#state{request_count = RequestCount + 1}}; 

142 handle_info(timeout, #state{lsock = LSock} = State) -> 

143 {ok, _Sock} = gen_tcp:ucceptCLS5ock), 

144 {noreply, State}. 

145 | 

146 NX---- hy 
147 %% @private A 
148  %% adoc - 
> 区 
Find: @ NextO] Previous[ | Match Case Goto Line: 





图 5-10” 显示 菜 模块 源码 的 调试 器 窗口 。 你 可 以 在 该 窗口 中 对 代码 进行 搜索 或 跳 转 到 
指定 行 。 双 击 某 行 可 以 在 改 和 ee 


自 完 , 让 我 们 来 设置 一 个 断 点 。 找 到 代码 中 的 do_rpc/2 录 数 ， 并 双击 调用 split_out_mfa 


(RawDatal) 的 





这 一 行 ， 在 行 号 之 后 ， 代 码 行 之 前 会 出 现 一 个 红色 的 轿 。 现 在 ， 像 之 前 一 样 调用 





application:start(tcp_rpc)， 并 用 3.3 节 中 介绍 的 方法 通过 Telnet 执 行 一 次 远程 调用 。 人 中 
所 料 ， 没 有 应 答 。 问 过 头 来 看 一 下 主 调试 器 窗口 你 会 看 到 名 为 tt_server 的 进程 被 挂 在 断 点 处 


如 图 5-11 所 示 。 


图 5-11 


beam.smp File Edit Module Process Break Options Windows Window Help 


nial Call ee 





<0.40.0> tr_server:handle info/2 tr_server break {tr_server,134} 








Auto Attach: 





L First Call 


On (with tail) 
Back Trace Size: 


100 





主 调试 絮 窗 口 ， 展 现 了 tr_server 中 被 命中 的 断 点 。 双 击 列表 中 的 进程 将 打开 
一 个 可 用 于 跟 该 进程 交互 的 新 窗口 
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双击 主 窗口 中 的 tr_server 进 程 , 会 打开 一 个 形 如 网 5$-12 的 新 窗口 。 通 过 该 窗口 你 可 以 与 连 
接 到 调试 大 的 进程 进行 交互 。 如 你 所 见 ,， 窗口 上 有 用 于 单 步 跟踪 、 继 续 执 行 等 功能 的 按钮 ， 与 普 
通 的 源码 级 调试 天 一 样 。 当 前 变量 的 值 显示 于 窗口 右 下 角 , 单 击 列表 中 的 变量 , 完整 的 值 将 显示 
于 左下 和 角 。, 在 源码 中 的 某 行 上 双击 可 以 在 该 行 上 添加 或 移 除 断 点 。 请 在 代码 中 执行 几 次 单 步 跟踪 ， 
看 看 会 发 生 些 什 么 。 
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全 牛人 中 Attach Process <0.40.0> 

121 “MyW-------------------------------------------------------------------- | 
122  %% 印 rivate | 
123  %% sdoc 

124 %% Handling all non call/cast messages 

J250 、: 

126 XY% Espec handle_info(Info, State) -> {noreply, State} 

127 XY {noreply, State, Timeout} 

128 ES {stop, Reason, Stote} 

129 ”和 Bend 

TT 


131 handle_info({tcp, Socket, RawData}, State) -> 

132 RequestCount = State#state.request_count, 

133 try 

134 DO io_tLib:formotC"you are here.")， 

135 {M, F, A} = split_out_mfa(RawData), 0 
136 Result = apply(M, F, A), 

137 gen_tcp:send(Socket, io_lib:fwrite("~p~n", [Result])) 

138 catch 

139 _C:E -> 











140 gen_tcp:send(Socket , io_lib:fwrite("~p~n" , [EJ)) 

141 end, 

142 {noreply, State#state{request_count = RequestCount + 1}}; 

143 handle_info(timeout, #state{lsock = LSock} = State) -> | 

144 fok,_Sock} = qen_tcp:accept(LSock), 4 

Find: @ Next(O Previous[L | Match Case Goto Line: 

( Step 人 Next ¥ Continue Y Finish Y Where Up Down | 

Evaluator: [Name a Value | 
RequestCount 0 | 
recl 0 
State {state,1055,#Port<0.772>,0 || 
RawData “atom.\r\n” | 
Socket #Port<0.2146> | 

| 


#Port<0.772> 








State: break [tr_server.erl/134] 


图 5-12 ”调试 从 窗口 ， 其 中 显示 的 是 连接 到 调试 天 上 的 茶 个 进程 当前 的 代码 位 置 。 
你 可 以 在 该 窗口 中 单 步 跟踪 代码 、 增 删 断 点 、 观 察 变量 


通过 菜单 你 可 以 设置 条 件 断 点 、 观 察 消息 队列 ,或 完成 一 些 其 他 的 操作 。 限 于 篇 幅 ,， 我 们 无 
法 在 此 详 述 这 些 选 项 , 但 我 们 建议 你 多 试 试 调试 各 ,好 好 了 解 一 下 它 的 用 途 。 我 们 希望 这 段 关于 
调试 带 的 简短 介绍 能 够 把 你 领 进门 ， 以 便 真 正 将 调试 名 运用 到 实战 中 。 

现在 ， 再 来 看 点 儿 别 的 : 一 个 用 于 观察 数据 而 非 代 码 的 工具 。 


5.4 表 查 看 器 TV 


TV 应 用 跟 我 们 之 前 讨论 的 其 他 工具 都 不 太一 样 , 无 论 是 Appmon、Pman 还 是 调试 入， 观察 的 
统统 都 是 运行 在 系统 中 的 代码 ，TV 则 用 于 查看 数据 。TV 是 表 查 看 右 ( Table Viewer ) 的 缩写 。 它 
可 用 于 查看 Erlang 中 两 种 主要 类 型 的 表 : ETS 表 和 Mnesia 表 。 我 们 在 2.14 方 介绍 过 ETS 表 ， 在 下 一 
章 你 就 会 用 到 它们 了 。Mnesia 数 据 库 则 将 在 第 9 章 介 绍 。 
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现在 ,我 们 先 来 简要 看 看 如 何 查 看 ETS 表 。TV 启 动 后 的 默认 视图 就 是 ETS。 在 Erlang shell 中 
输入 tv:start() 便 可 启动 TV 主 窗 口 ， 如 图 5-13 所 示 。 
Terminal Shell Edit View Window Help 


eReNs [TV] ETS tables on nonode@nohost 
“Fie | View Options Help 





Table Name Table ld Owner Pid Owner Name 


wx_debug_info 











图 $-13 TV 表 查 看 需 的 主 窗口 。 默 认 不 显示 系统 表 


在 没有 运行 任何 用 户 应 用 的 Erlang 系 统 中 ， 一 开始 只 有 很 少 几 张 表 ， 甚 至 一 张 表 也 看 不 到 。 
点 选 Options 一 System Tables 采 单项 ,然后 便 会 显示 出 一 张 长 长 的 数据 表 列 表 。 在 列表 的 项 端 ， 你 
将 找到 一 个 名 为 ac_tab 的 条 目 ， 隶 属于 application _ controller 进 程 。 双 击 该 条 目 〈 或 先 单 击 该 条 
目 再 点 选 File 一 Open Table 荣 单项 ) 将 打开 一 个 形 如 图 5-14 的 新 窗口 ， 其 中 显示 的 是 表 中 的 内 容 。 











BeOe  - V]_ETS: ac_tab Node: nonode@nohost 














File | Edit | View | Options | a | 
由 的 [lil [el [1 [9%| 





R1 X C2 


» 2 4 5 py 6 

1 {application_mda <0.8.0> 

2 fienvstdibincdd | | | | | 
3 )iloadedkernelllfapplkernetad | | | | 
4 fevkemebindl0 | | | | | 
5 Jievkemeberrdtty | | | | | 
046 )iloaded,stdiib}|{applstdiiblap| | | | | 
一 | 


9 
bo ) 
CC 


12 











图 5-14 TV 表 和 窗口 。 本 例 中 显示 的 是 系统 表 ac_tab 的 内 容 
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如 你 所 见 ，TV 以 类 似 电子 表格 的 形式 来 展示 数据 表 。 其 中 一 列 带 有 和 钥匙 标 记 ( 位 于 第 一 列 
上 方 )， 表 示 这 一 列 是 主键 。 你 可 以 调整 列 宽 来 更 好 地 查看 数据 内 容 。 这 个 例子 中 展示 的 是 隶属 
于 Erlang 系 统 顶层 应 用 控制 右 的 一 张 系 统 表 。 其 中 包含 Erlang 的 两 个 核心 应 用 一 一 kernel 和 stdlib 
的 部 分 信息 ( 根据 系统 的 不 同 ， 可 能 还 含有 更 多 应 用 中 的 信息 )。 

TV 应 用 的 界面 基本 上 一 目 了 然 ， 因 此 我 们 希望 你 自行 尝试 和 学 习 。 菜 单 和 图 标 提供 了 排序 
和 轮 询 的 选项 ,你 可 以 获取 有 关 某 张 表 的 更 为 详尽 的 信息 、 搜 索 表 项 ,还 可 以 实时 编辑 或 删除 表 
项 。 在 后 续 章 节 中 用 到 ETS 表 和 Mnesia 时 可 不 要 忘 了 TV， 它 可 以 帮助 你 更 好 地 观察 数据 的 变化 。 

4 个 GUI 工 具 的 介绍 就 到 此 绪 束 了 。 虽然 它们 功能 各 异 ， 却 都 有 一 个 共同 点 : 都 可 以 从 Erlang 
工具 栏 启 动 。 





























5.5 ”工具 栏 


工具 栏 应 用 是 一 个 小 窗口 ， 窗 口中 的 每 个 图 标 对 应 于 一 个 应 用 。 如 果 要 频繁 使 用 这 些 工 具 ， 
例如 在 调试 时 ， 比 起 像 之 前 那样 独立 启动 各 个 应 用 , 局 动工 具 栏 并 把 它 丢 到 果 面 的 一 角 会 更 为 便 
捷 。 在 Erlang shell 中 调用 toolbar:start()， 便 会 看 到 如 图 5-15 的 和 窗口。 














A MA ErlangTools 
| File | Tools | Help | 





图 5$-15 ”Erlang 工具 栏 。 如 有 果 需 要 频繁 启动 TV、Pman、Debugger 或 Appmon,， 
工具 栏 会 很 方便 。 你 甚至 还 可 以 向 工具 栏 上 添加 自 定 义 图 标 


第 一 个 按钮 可 以 启动 TV， 下 一 个 可 以 启动 Pman， 第 三 个 可 以 启动 Debugger， 第 四 个 可 以 启 
动 Appmon。 男 外 ,虽然 并 不 第 用 , 但 你 也 可 以 癌 工 具 栏 上 添加 用 于 启动 其 他 目 定 义 应 用 的 按钮 : 
先 点 选 Tools 一 Create Tool File， 然 后 填写 新 工具 的 详细 信息 ， 包 括 你 要 使 用 的 图 标 文件 以 及 用 于 
在 点 击 图 标 后 局 动工 具 的 模块 和 国 数 。 人 例如， 指定 mymod 和 myfun 将 调用 mymodq:myfun()。( 工 
具 启 动 函 数 不 接 受 任何 参数 。) 











5.6 ”小结 


我 们 在 此 介绍 了 用 于 观察 运行 中 的 Erlang 系 统 并 与 之 进行 交互 的 主要 可 视 化 工具 。 我 们 希望 
这 些 内 容 足 以 帮助 你 把 它们 变 成 你 的 日 党 工具。 现在 你 可 以 继续 自行 深入 探索 了 。 在 官方 
Erlang/OTP 文 档 的 工具 一 节 可 以 找到 更 多 相关 内 容 。 
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构建 生产 系统 








欢迎 回 到 真切 的 大 千 世 界 ， 这 里 才 是 OTP 的 用 武之 地 。 在 本 书 的 这 一 部 分 中 ， 我 们 将 跟随 
Erlware 团队 运用 Erlang， 特 别 是 OTP， 来 解决 他 们 所 面临 的 一 系列 问题 。 这 一 部 分 的 内 容 将 涵 
状 行 为 模式 、 监 控 、 打 包 以 及 许多 其 他 的 用 于 构建 工业 级 Erlang 软件 的 关键 手法 和 技术 。 
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打造 一 套 缓存 系统 





本 章 慨 要 

口 设计 一 个 徐 单 的 缓存 服务 

口 建立 基本 的 应 用 结构 与 监督 结构 
口 实现 缓存 的 主要 功能 











现在 你 已 经 对 Erlang/OTP 有 了 基本 的 了 解 , 该 回 更 高 级 也 更 现实 的 案例 迈进 了 。 从 本 曹 开 始 ， 
本 书 的 第 二 部 分 将 市 你 一 起 搭建 一 个 实用 的 分 布 式 Erlang 应 用 。 为 了 明确 这 些 任 务 背 后 的 动机 ， 
我 们 将 以 一 个 名 为 Erlware 的 开源 项 目 为 背景 来 讲述 整个 开发 过 程 , 这 个 项 目 正 面临 者 一 系列 假想 
但 却 富 有 现实 意义 的 挑战 ， 你 的 任务 就 是 解决 这 些 难 题 。 


6.1 故事 背景 


Erlware 项 目 旨 在 让 人 们 更 便捷 地 获取 所 需 的 Erlang 应 用 ， 从 而 为 应 用 的 终端 用 户 以 及 那些 期 
望 将 应 用 用 到 自己 的 项 目 中 的 开发 者 提供 便利 。 随 着 Erlang 的 日 益 流 行 ， 便 捷 地 获取 开源 应 用 及 
构建 工具 的 需求 也 越 来 越 旺盛 。 这 给 Erlware 项 目 带 来 了 迅猛 增长 , 但 与 此 同时 用 户 的 抱怨 声 也 啊 
了 起 来 , 项 目 管 理 员 们 发 现 网 站 当前 的 啊 应 速度 已 经 无 法 满足 用 户 的 需求 了 。 各 种 怨言 中 针对 网 
页 加 载 速 度 的 最 多 。 不 过 ,Erlware 团 队 十 分 关注 用 户 体验 , 更 何况 有 传言 说 Google 等 搜索 引擎 会 
降低 页 面 加 载 速度 慢 的 站 点 的 权重 。 

用 户 抱 怨 最 多 的 就 是 软件 包 搜 索 页 面 。 在 该 页 面 上 , 用 户 可 以 从 庞大 的 Erlware 库 里 搜索 特定 
的 Erlang/OTP 软 件 。 为 了 生成 这 个 页 面 ，Web 服 务 人 大 必须 访问 一 组 软件 包 服 务 兹 并 癌 每 人 台 服 务 俐 
请 求 一 份 软件 包 列 表 , 每 台 服务 右 所 保存 的 软件 包 列 表 的 内 容 互 不 相交 。 软件 包 服务 右 之 间 相 互 
独立 , 也 不 存在 持 有 所 有 软件 包 数 据 的 中 央 数 据 库 。 早 和 完 Erlware 的 规模 还 小 , 仅 有 一 台 软 件 包 服 
务 益 ， 这 个 架构 没什么 问题 。 即 便 后 来 服务 右 增 加 到 了 3 台 ， 和 情况 也 都 还 好 ， 但 再 加 服务 右 的 话 
就 不 行 了 。 该 系统 的 结构 如 图 6-1 所 示 。 
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二 丈 的 软 狂 本 
- 下 完 和 软件 包 服务 器 
器 的 请 求 。 | 1 请 求 软件 包 列表 
Pope 
“站 完整 软件 包 服务 器 





的 
包 列 软体 


图 6-1 Erlware 当 前 的 架构 : Web 服 务 器 在 处 理 每 个 请 求 时 都 会 从 所 有 软件 包 服务 器 上 
抓 取 一 份 完整 的 列表 
Erlware 团 队 的 成 员 桶 在 一 起 讨论 加 速 方案 ， 最 终 决 定 通过 给 Web 服 务 硕 添加 本 地 组 人 存 来 提速 。 
这 样 一 来 , 查询 软件 包 列 表 的 同时 ， 软 件 包 服务 胡 返 回 的 列表 将 以 URL 为 键 存 人 缓存 ; 随后 ， 当 用 
户 访问 同一 个 URL 时 ， 百 接 从 缓存 中 取出 软件 包 列表 便 可 迅速 完成 页 面 泻 染 。 该 架构 如 图 6-2 所 示 。 


本 没有 有 
缓存 中 这 
pr 枯 休 服务 
发 往 Web 服 务 “ 软 亿 包 列 帮 
pe 多/ 直下 . 从 缓存 中 查找 软件 包 
妖 的 请 求 
===》 





列表 
. 如 采 缓 存 未 命中 ， 请 > 
求 软 件 包 列表 A 
| 聚合 列表 借 凡 出 拉 到 之 有 软件 包 服 务 器 








图 6-2 ”规划 中 的 新 架构 。Web 服 务 胡 将 软件 包 列 表 放 入 本 地 缓存 ， 这 样 就 无 须 在 处 理 
每 一 个 请 求 时 都 做 一 遍 查 询 了 


该 缓存 服务 将 以 独立 OTP 应 用 的 形式 来 实现 。 本 章 后 续 内 容 便 以 该 组 人 存 系 统 的 基本 功能 为 中 
这 些 功能 大 体 包括 : 

口 绥 存 的 局 动 和 停止 ; 

口 向 缓存 中 添加 键 / 值 对 ; 

口 查询 与 给 定 的 键 相对 应 的 值 ; 

口 更 新 与 给 定 的 键 相对 应 的 值 ; 

口 删除 键 / 值 对 。 

有 了 这 些 , 你 便 能 够 搭建 出 一 个 极为 简单 但 五 脏 俱全 的 缓存 服务 。 本 章 中 搭建 的 是 该 缓存 服 
务 的 第 一 个 版 本 ， 它 没有 什么 局 级 功能 ， 只 是 一 个 可 以 通过 普通 Erlang 捕 数 调 用 来 访问 的 独立 绥 
存 服务 , 用 于 加 速 单 合 服务 郁 上 的 单个 Web 服 务 表 。 分 布 式 文 持 等 局 级 特性 将 留待 后 续 章 节 实 现 。 
在 看 手 实现 这 个 基本 的 绥 存 服务 之 前 ， 我 们 不 妨 先 来 讨论 一 下 设计 方 条 。 


6.2 缓存 的 设计 
这 个 简易 缓存 存储 的 是 键 / 值 对 ， 其 中 键 与 键 之 间 不 得 重复 ， 并 且 每 个 键 只 能 映射 到 一 个 值 。 
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这 个 设计 背后 的 核心 思想 古 为 写 和 人 绥 存 的 每 一 个 值 都 分 配 一 个 独立 的 存储 进程 , 再 将 对 应 的 键 映 
财 至 该 进程 。 你 可 能 会 对 这 种 为 每 个 值 分 配 一 个 进程 的 设计 感到 惊讶 ,其 至 觉得 不 可 思议 ; 但 对 
缓存 这 类 服务 而 言 ， 这 个 设计 是 合理 的 ， 因 为 缓存 中 的 值 相 互 独立 ， 各 有 各 的 生命 周期 。 同 时 ， 
Erlang 本 吴 对 大 量 轻 量 级 进程 提供 了 民 好 的 文 持 ， 使 得 这 种 设计 成 为 可 能 。 

为 了 搭建 这 个 缓存 ， 你 得 先 建立 一 些 基本 的 子 系统 ， 其 中 每 个 子 系统 都 是 一 个 独立 的 模块 。 
图 6-3 展 示 了 该 简易 缓存 的 各 个 组 成 部 分 。 


























应 用 行为 模式 模块 
= sc app 

简易 缓存 用 户 

由 此 进入 | 简易 缓存 API 模 块 


= simple cache 


() 监督 者 模块 = sc_sup 
键 和 值 存 储 进程 之 间 CC 


映射 关系 的 存储 模块 值 存储 进程 模块 


= se store = sc element 


图 6-3 ”人 简易 缓存 的 各 个 部 件 。 包 括 API 前 端 、 主 应 用 模块 、 奢 干 数据 存储 进程 、 监 督 
者 模块 ， 以 及 负责 维护 键 和 数据 存储 进程 之 间 上 映射 关 系 的 映射 表 


如 图 6-3 所 示 ， 你 一 共和 需要 创建 5 个 模块 ， 详 情 参 见 表 6-1。 


表 6-1 简易 缓存 应 用 中 的 模块 








模 块 用 途 
simple cache 用 户 API; 应 用 的 外 部 接口 
sc_ app 应 用 行为 模式 实现 模块 
sc_sup 根 监督 者 实现 模块 
sé store 用 于 封装 键 和 pid 之 间 映 射 关 系 的 模块 
sc element 缓存 数据 存储 进程 
模块 命名 规范 


还 记得 我 们 在 3.2 节 提 到 过 的 模块 命名 规范 吗 ? 这 个 应 用 中 除 主 用 户 API 模块 
simple cache 以 外 ， 所 有 模块 都 以 sc (代表 Simple Cache ) 为 前 级 。OTP 应 用 往往 有 一 个 与 
应 用 同名 的 前 端 模 块 ， 这 种 模式 很 常见 。 





用 户 只 能 通过 simple cache API 模块 与 缓存 服务 交互 。 该 模块 直接 与 sc_store 模 块 和 sc_element 
模块 通信 ， 前 者 负责 维护 键 和 进程 间 的 映射 关系 ， 后 者 负责 存储 进程 的 创建 、 更 新 和 删除 。 所 有 
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存储 进程 部 受 sc_sup 监 督 进程 监督 ， 除 此 之 外 ， 还 有 一 个 负责 整个 缓存 系统 的 局 动 和 集 止 的 应 用 
行为 模式 模块 sc_app。 图 6-4 从 进程 和 数据 流 的 角度 展示 了 该 洒 构 。 


simple_cache 





sc_store 


图 6-4 ”模块 及 相应 进程 间 的 数据 流 。 用 户 API 模 块 simple_cache 仪 跟 sce_store 和 
sc_clement 模 块 直接 通信 


在 处 理 运行 时 的 键 / 值 对 插入 操作 时 ， 监 督 进程 会 按 需 派生 sc_element 进 程 。 派 生出 来 的 进程 
会 记 住 与 给 定 的 键 相关 联 的 值 ， 随 后 ，sc_store 会 记录 下 该 键 与 该 进程 ID 间 的 映射 天 系 。 键 / 值 之 
间 的 映射 关系 就 这 样 建立 起 来 了 。 要 获取 与 指定 的 键 相关 联 的 值 , 首先 应 该 查找 与 键 相关 联 的 存 
储 进程 的 ID， 然 后 再 向 该 进程 查询 当前 持 有 的 值 便 可 。 图 6-5 是 这 层 间 接 映 射 关 系 的 图 解 。 











指 问 








图 6-5” 键 / 值 之 间 的 间接 映射 。 每 个 值 都 由 单独 的 进程 负责 存储 
这 些 想法 目前 看 来 可 能 有 些 为 类 ,但 这 个 涤 构 可 以 有 效 发 挥 出 OTP 中 很 多 强大 机 制 的 威力 。 
行 到 本 章 结束 之 时 , 你 将 会 发 现 目 己 无 傍 获 得 了 多 么 丰富 的 功能 , 而 且 所 有 这 一 切 仪 需 寥寥 数 行 
代码 而 已 。 困 话 少 说 ， 让 我 们 先 来 搭建 绥 存 服务 的 应 用 基础 架构 吧 。 
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6.3 创建 OTP 应 用 的 基本 骨架 


规范 的 OTP 应 用 是 一 切 优秀 Erang 项 目的 立足 点 。 一 个 项 目 通 稼 可 以 分 解 成 多 个 应 用 , 不 过 , 仅 
就 目前 的 简易 绥 存 服务 而 言 , 一 个 应 用 就 足够 了 了 (当然 , 在 设计 上 它 仍然 可 以 被 用 其 他 项 目的 组 件 )。 

这 一 节 将 沿用 第 4 章 中 搭建 tt_server 应 用 的 方法 。 但 这 次 我 们 换个 思路 : 先 不 考虑 任何 实际 功 
能 ， 仪 从 设计 和 角度 出 发 搭 出 一 个 应 用 上 骨架， 之 后 再 逐步 瀛 砖 加 瓦 。 

概括 来 说 ， 应 用 结构 的 搭建 分 为 以 下 几 个 步骤 : 

(1) 创建 标准 应 用 目录 布局 ; 

(2) 编写 .app 文 件 ; 

(3) 编号 应 用 行为 模式 实现 模块 ， 即 sc_app; 

(4) 实现 顶层 监督 者 ， 即 sc_sup。 

我 们 所 要 搭建 的 是 个 具备 自主 运转 能 力 的 主动 应 用 , 为 此 我 们 还 需要 准备 一 个 应 用 行为 模式 
的 实现 模块 和 一 个 根 监 督 者 。 膛 循 第 4 章 中 的 规范 ， 这 两 个 模块 的 名 称 应 该 分 别 以 app 和 _sup 结 
尾 。 不 过 在 此 之 前 ， 得 先 建 好 目录 结构 。 


6.3.1 应 用 目录 结构 的 布局 


首先 新 建 一 个 名 为 simple_cache 的 顶层 应 用 目录 。 在 该 目录 下 ， 如 4.1.1 节 介绍 的 那样 ， 新 建 
doc、ebin 、include 、priv 和 src 等 子 目 录 。 最 终 的 目录 树 应 该 是 这 样 的 : 


simple _ cache 















































doc 
ebin 
linclude 
PIiV 





( 这 个 例子 还 用 不 上 doc、 ee 目录 ,不 过 ,反正 多 建 几 个 日 录 没 有 什么 坏处 ， 以 备 
不 时 之 需 吧 。) 目录 布局 完毕 后 ， 下 一 步 就 是 布置 .app 文 件 。 


6.3.2 创建 应 用 元 数据 


如 4.1.2 方 所 述 ， 在 启动 应 用 或 在 执行 运行 时 代码 热 升 级 时 ，OTP 需 要 了 解 一 些 用 于 摘 述 应 用 
目 身 的 元 数据 。 存 放 元 数据 的 .app 文 件 的 文件 名 应 该 与 应 用 名 相 匹 配 〈 但 无 顷 采 用 特定 模块 的 名 
字 )， 在 这 个 例子 中 ， 该 文件 就 是 ebin/simple cache.app。.app 文 件 当前 内 容 如 下 : 


{application, simple cache, 
[ {description, "A simple caching system"}, 
{ven, "OO.1.0"}, 
{modules, | 
号 CPP 
SC_SUP 


| 
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{registered, [sc _ sup]}, 
{applications, [kernel, stdlib]}, 
‘med sc appe [LJ]: 


| 
与 代码 清单 4-1 作 个 比较 , 你 会 发 现 二 者 很 相似 。 sec_app 和 sc_sup 这 两 个 模块 肯定 是 少不了 的 ， 
已 经 罗列 在 内 ; 其 余 模 块 则 将 在 后 续 逐 步 加 入 该 列表 。 男 外 ， 很 明显 根 监督 者 应 该 以 sce_sup 为 注 
册 名 进行 注册 。 
骨架 已 经 搭建 完毕 ， 接 下 来 就 要 给 应 用 行为 模式 的 实现 模块 添砖加瓦 了 。 


6.3.3 ”实现 应 用 行为 模式 


应 用 行为 模式 的 实现 位 于 文件 src/sc_app.erl 内 ， 如 代码 清单 6-1 所 示 。 不 妨 将 之 与 4.1.3 节 中 的 
tr app.erl 作 个 比较 。 特 别 需 要 注音 的 是 ，.app 文 件 中 的 mod 元 组 给 出 了 应 用 行为 模式 模块 的 模块 
名 ， 系 统 就 是 从 这 里 得 知 应 该 从 何人 处 启动 和 停止 应 用 的 。 


代码 清单 6-1 src/sc app.erl 


-module(sc app). 



































加 行为 模式 声明 
-behavi licati 、 可 四 可 
ee 导出 的 行为 模式 回调 函数 
-GeGXPort (lstart/2, stop/1])}). , < 十 一 





start(_ StartType, _StartArgs) -> 
case sc sup:start link{) of Es 
{ok, Pid} -> 启动 根 监 督 者 
{ok, Pid}; 
Other -> 
{error, Other} 
end. 


stop{( State}) -> 
Ok. 


sc_app 柑 块 唯一 的 任务 就 是 在 应 用 局 动 时 局 动 根 监 督 者 (在 6.4.2 广 中 会 对 这 个 地 方 和 作 修 
改 )。 在 应 用 停止 时 则 什么 也 不 用 做 。 








6.3.4 ”实现 监督 


根 监督 者 在 文件 src/sce_sup.erl 中 实现 ( 参见 代码 清单 6-2 )。 此 处 用 到 的 监督 者 与 第 4 章 中 创建 
的 监督 者 不 同 ; 我 们 没有 给 这 个 监督 者 静态 指 铂 任何 永久 子 进程 , 但 却 可 以 给 它 劲 态 染 加 任意 多 
个 同类 型 的 临时 子 进程 。 














代码 清单 6-2 src/sc_sup.erl 
-modulelsc sup}). 


-behaviour (supervisor). 


export( [start 工 工 站 后 DO: 国 动态 启动 子 进程 
start_child/2 
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Ds 


-export ([init/1])}). 
sc element:start link/2 的 参 数 
-define (SERVER, ?MODULE). 


start link() -> 
supervisor:start _ link{({local, ?SERVER}, ?MODULE, [|]}). 














start childiValue, LeaseTime}) 一 > 

Supervisor:start child{({?SERVER, [Valjue, LeaseTimel]}. < 一 
init([]}) -> 

Element = {sc element, {sc element, start link, []}, 

temoorarvy, brutal kill, worker, [gc element]}, 

Children = [Element], . 

RestartSstrategy = {simple one for one, 0, 1}, 

{ok, {RestartSstrategy, Children}}. 

大 
.简易 一 对 一 监督 


ee 役 定 为 simple_one_for_one (简易 一 对 一 监督 )。 采 用 诸如 4.2.1 市 
bie for_one 等 其 他 重启 策略 时 ， 监 督 者 一 般 需 要 同时 管理 多 个 与 利己 同时 启动 的 子 
进程 ， 通 常 这些 子 进程 的 生命 周期 也 与 览 督 者 相同 。simple_one_for_one 型 监督 者 只 能 启动 
0 云 行 时 动态 添加 的 ， 监 督 者 本 身 在 启 
动 时 不 会 局 动 任何 子 进程 。 

观察 代码 清单 6-2 中 的 监督 者 模块 ， 它 的 ijnit/1 函 数 与 代码 清单 4-3 中 的 init/1 很 相似 。 此 
前 虽然 我 们 也 只 用 到 了 一 个 子 进程 规范 ,但 现在 却 只 能 有 一 个 : simple_one_for_one 型 监督 者 
的 iniby1 必 须 指 定 一 种 且 仅 一 种 子 进程 ， 但 子 进程 并 不 会 随 监督 者 一 同 启动 。 不 过 ， 你 随时 可 以 通 
过 调用 简化 厂 supervisor:start_childq/2 困 数 ， ee 其 他 类 型 的 监督 者 
在 动态 添加 子 进程 时 ， 必 须 将 完整 的 子 进程 规范 传递 给 start_child/2。 但 对 于 simple_one 
for_one 型 监督 者 而 言 ， 由 于 所 有 子 进 程 都 遵循 同一 进程 规范 ， 你 只 需要 说 一 声 “ 有 再 
来 一 份 ” 就 可 以 了 。 这 僚机 制 恰恰 可 以 满足 你 当前 的 需求 。 

2 监督 者 模块 

sc_Sup 模 块 有 两 个 API 困 数 ， 人 代码 清单 4-3 中 的 tr_sup 则 只 有 一 人 个。 前文 已 经 摘 述 了 新 出 现 的 
start_child/2 了 因数 的 作用 : 令 运 行 中 的 监督 者 〈 由 ?SERVER 标识 ) 局 动 一 个 新 的 子 进 程 ， 并 
将 Value 和 LeaseTime 参 数 传 给 子 进程 的 人 人 口 函 数 ( 因为 每 个 子 进程 的 这 两 个 参数 各 不 相同 )。 
将 这 些 逻 辑 组 织 成 一 个 API 耳 数 将 更 有 利于 模块 中 实现 细 市 的 封装 

init/1 捕 数 与 代码 清单 4-3 中 的 版 本 有 些 细微 的 差别 ， 请 仔细 阅读 并 参阅 4.2.3 厄 比较 一 下 个 
中 细节 。 二 者 最 核心 的 区 别 显然 在 于 重启 策略 的 不 同 ， 此 处 采用 的 策略 是 simple_one_for_ 
one， 重 启 执 行 频 率 最 多 为 每 秒 0 次 ( 即 不 执行 重启 )。 这 个 监督 者 的 子 进程 被 标 为 temporary 型 
而 非 permanent 型 ， 也 就 是 说 子 进 程 退 出 后 无 须 重启 。 在 很 大 程度 上 ， 这 个 监督 者 不 过 是 
sc_element 进 程 的 一 个 工厂 而 已 。 此 外 ， 此 处 的 关闭 策略 也 被 设置 成 了 brutal_ki1l1， 表 示 子 进 
程 应 随 监督 者 的 关闭 而 立即 终止 。( 对 于 simple_one_for_one 型 监督 者 而 言 ， 监 督 者 无 须 费心 
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主动 关闭 子 进程 ; 一 收 到 监督 者 终止 时 触发 的 退出 信号 子 进 程 便 会 立即 目 行 终止 。 只 要 子 进 程 萤 
循 标准 的 OTP 行 为 模式 , 这 一 点 便 确 玄 无 疑 。 此 处 之 所 以 还 要 写 明 brutal_kil11， 主 要 还 是 用 于 
明确 表明 意图 。) 

调用 start_child/2 API 图 数 时 ， 当 前 进程 会 向 监督 进程 发 送 一 条 消息 ， 令 它 以 value 和 
LeaseTime 为 参数 调用 sc_element 模 块 的 start_Link 国 数 ， 进而 启动 一 个 新 的 子 进程 。 子 进 程 
规范 中 的 元 组 

{sc_element，Statrt_ link, []} 
给 定 了 模块 名 、 隐 数 名 和 子 进程 局 动 孙 数 的 参数 ， 调 用 start_1link 之 前 ， 列 表 [Value， 
LeaseTime] 将 被 并 入 参数 列表 [] ， 从 而 形成 最 终 的 函数 调用 sc_element:start_link 
(Value, LeaseTime).。 | 

每 调用 一 次 sc_sup:start _child/ 23 就 会 新 启动 一 个 市 有 日 己 的 值 和 淘汰 时 间 的 sc_element 
进程 。 这 就 形成 了 一 棵 动态 生成 的 监督 树 ， 如 图 6-6 所 示 。 














图 6-6 ”简易 一 对 一 监督 的 层级 结构 。 所 有 子 进 程 同 为 一 个 类 型 ， 可 动态 增删 且 数 量 任意 


至 此 ， 一 个 可 运行 的 应 用 骨架 就 搭建 完毕 了 。 你 可 以 从 Erlang shell 中 局 动 它 并 观察 它 的 运作 
情况 。 当 然 ， 目 前 除了 局 动 和 俘 止 应 用 以 外 你 还 什么 都 做 不 了 , 因为 应 用 的 实际 功能 和 用 户 接口 
都 还 没有 实现 。 由 于 采用 了 simple_one_for_one 型 监督 策略 ， 监 督 者 在 局 动 时 不 会 司 动 任何 
子 进 程 ; 此 外 ， 由 于 sc_element 尚 未 实现 , 调用 sc_sup:start_chi1d/2 会 触发 运行 时 错误 。 本 
章 后 续 内 容 将 逐步 添加 这 些 功 能 ， 最 终 实 现 一 个 羽 愤 丰满 的 simple cache 应 用 。 


6.4 ”从 应 用 骨架 到 五 脏 俱全 的 缓存 


在 继续 学 习 之 前 ， 请 再 看 一 看 图 6-3 所 示 的 Simple Cache 应 用 的 设计 思路 ， 同 时 请 回顾 一 下 表 
6-1 中 列 出 的 竺 实现 的 模块 。 没 销 ， 应 用 中 最 基本 的 sc app 和 sc_sup 已 经 完成 了 。 剩 下 的 还 有 : 

D simple _ cache 一 一 用 户 API; 

D sc_element 一 一 用 于 存储 绥 存 数据 的 进程 ; 

D sc_store 一 一 用 于 维护 键 与 进程 间 的 映射 关系 。 

接 下 来 ,首先 要 实现 se_element 模 块 ， 这 样 项 层 的 监督 者 才 有 子 进程 可 供 启动 。 随 后 有 要 实现 
的 是 sc_store， 用 于 建立 键 与 进程 间 的 映射 和 关系， 最 后 我 们 还 需要 一 个 API 模 块 ， 从 而 为 整个 应 用 
提供 一 套 恨 好 的 接口 。 
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6.4.1 编写 sc_element 进 程 


sc_element 模 块 实 现 了 se_sup 的 子 进程 ,每 当 有 新 数据 插入 缓存 时 ，sc_sup 就 会 派生 出 一 个 新 
的 sec_element 进 程 ， 用 于 存储 与 给 定 的 键 相 关联 的 数据 。 我 们 打算 以 gen_server 行 为 模式 为 基 
础 来 实现 这 类 进程 (类似 于 第 3 章 中 的 tr server )， 数 据 将 被 保存 在 gen _ server 进 程 的 进程 状态 中 。 
gen_server 的 工作 原理 请 参阅 第 3 草 ， 此 处 不 再 袭 述 。 

1. 模块 首部 

代码 清单 6-3 所 示 的 模块 首部 与 代码 清单 3-2 类 似 ， 你 应 该 已 经 很 熟悉 了 。 二 者 的 主要 区 别 在 
于 API， 这 是 理所当然 的 一 一 虽然 内 部 都 基于 同一 框架 ， 两 个 服务 冀 的 用 途 却 不 尽 相 同 。 你 要 实 
现 的 主要 功能 有 四 个 : 新 元 泰 创建 、 元 素 值 查 询 、 元 泰 值 茶 换 ， 以 及 元 素 删 除 。 


代码 清单 6-3 ”src/sc element.erl 的 首部 


-module{sc element)}. 




















-behaviour (gen server). 





-exportt | 
start_ link/2, 
create/2, 
create/1, 
fetch/1, 
replace/2, 
delete/l1 
1 


-export([init/l1, handle_ call/3, handle cast/2, handle_ lnfto72， 
terminate/2, code change/3]). 


-define (SERVER, ?MODULE). | 一 天 中 的 总 秒 数 
-define (DEFAULT LEASE TIME, (60 * 60 * 24)). 


导出 的 API 函 数 








状态 记录 


_record (state, {value, lease time, start time}). 人 

刍 / 值 对 在 缓存 中 存活 一 段 时 间 之 后 便 会 被 清理 出 局 ， 这 上 段 时 间 称 作 淘 汰 时 间 。DEFAULT_ 
LEASE_TIME 便 是 默认 的 淘汰 时 间 ( 以 秒 为 单位 )。 设 定 淘汰 时 间 的 目的 在 于 保证 缓存 中 的 内 容 
足够 新 ， 绥 存 就 是 缓存 ， 不 是 数据 库 。 创 建 se element 进 程 时 ， 你 可 以 通过 API 自 行 调整 这 个 值 。 

模块 首部 的 最 后 一 项 定义 了 用 于 表示 gen_server 进 程 状 态 的 记录 。 它 由 3 个 字段 组 成 : 进程 持 
有 的 值 、 淘 汰 时 间 ， 以 及 进程 启动 时 的 时 间 鹤 。 

2. API 段 和 进程 的 局 动 

模块 中 的 下 一 部 分 就 是 API 的 实现 ， 如 代码 清单 6-4 所 示 。 


代码 清单 6-4 。 src/sc element.erl 的 API 有 段 


start link(Value, LeaseTime) -> 
gen_ server:start_link(?MODULE, [Value, LeaseTime], [|]). 














create{(Value, LeaseTime) -> 
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sc sup:start child(Value, LeaseTime). < 十 一 _ 
将 启动 委托 给 sc_sup 





createlValue) -> 
create(Value, ?DEFAULT LEASE TIME). 


fetch{({Pid}) -> 
gen_server:call (Pid, fetch). 





replace(Pid, Value) -> 
gen server:cast (Pid, {replace, Valuel}). 





Qelete{P1id}) -> 
gen server:cast (Pid, delete). 


正如 我 们 在 6.3.4 节 说 明 的 那样 ， 子 进程 由 监督 者 负责 创建 ; 个 中 细节 则 由 监督 者 的 API 函 数 
sc_sup:start_child/2 人 负责 屏 散 。 然 而 ， 监 督 者 的 存在 属于 实现 细节 ，sc_element 的 用 户 并 不 
关心 。 为 此 ,我 们 创建 了 API 四 数 create/2， 用 于 将 创建 子 进 程 的 任务 委托 给 sc _Sup。 此 外 ， 如 
有 果 百 接 采 用 默认 淘汰 时 间 ， 还 可 以 选用 更 为 简化 的 create/1L1。 这 下 即便 把 底层 实现 改 个 底 儿 天 
天 ， 也 不 用 动 接口 层 了 。 

回顾 一 下 ， 我 们 在 6.3.4 市 为 simple_one_for_one 型 监督 者 设 定 了 子 进程 规范 ， 于 是 每 当 
sc_sup:start_chi1lqd/2 创 建新 的 子 进 程 时 ， 它 都 会 回调 sc_element:start_link(Value, 
LeaseTime) 。 与 代码 清单 3-3 中 的 tr_server:start _ link/1 类 似 ， 这 个 API 哨 数 将 会 进一步 
调用 更 为 标准 的 函数 ( 这 里 指 gen_server:start_link/3 )。 但 是 在 这 里 ， 最 终 用 户 不 应 该 直 
接 调 用 start_link/2 (那样 的 话 启动 起 来 的 进程 将 无 法 接受 监督 )， 也 无 须 劳 烦 gen_server 库 为 
你 完成 进程 注册 ( 因为 sc_element 进 程 数 量 众 多 ， 不 是 单 例 )。 

这 个 调用 流程 很 是 令 人 费解 ， me 彻底 搞 清楚 来 龙 去 脉 。 插 入 新 元 素 时 ， 
应 调用 sc_element :create( . sa) 3 该 调用 会 将 任务 委托 给 监督 者 API 了 喘 数 sc_ sup:start 
child/2, 进而 由 监督 者 调用 库 也 |: id start child/2。 借助 子 进程 规范 及 附加 的 
调用 参数 value 和 LeaseTime, 监督 者 的 代码 义 会 回调 sc_element:start_link/2。 这 里 还 没 
有 讲 到 sc_element 进 程 的 实现 方式 ， 不 过 由 于 该 模块 以 gen_servez 为 基础 ， 调 用 流程 至 此 将 被 
转交 给 库 晒 数 gen_server:start_1Link/3 ,并 最 终 将 新 的 子 进程 局 动 起 来 。 整 个 调用 流程 如 同 
6-7 所 未 。 









































simple_cache 
AS sc_element 


图 6-7 存储 新 存储 时 的 调用 流程 。 其 中 sc element API 回 simple cache 屏 滴 了 sc _ sup 的 
存在 。 同 时 ，sc_sup 也 不 关心 sc_element 的 功能 细节 





start_link() 
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其 余 的 儿 个 API 函 数 





fetch/1、replace/2 和 delete/1 一 一 都 比较 人 简单， 和 代码 清单 


3-3 中 fr_server 的 API 国 数 差不多 。 它 们 的 任务 无 非 就 是 利用 cal11 或 cast 回 进程 发 送 请 求 。 其 中 又 
只 有 fetch/1 需 要 等 待 应答， 因此 其 他 两 个 API 可 以 采用 异步 的 cast 从 而 立即 返回 至 调用 方 。 这 
个 模块 与 tr server 有 一 个 细微 而 关键 的 差别 ， 就 是 所 有 sc_element 进 程 都 没有 注册 名 。( 因为 它们 
的 数量 不 受 限 制 。) 也 就 是 说 API 函 数 必须 包含 进程 标识 从 ， 否 则 gen_server 的 限 数 就 没 法 知道 
该 将 消息 发 往 何 处 了 。 当 然 , 这 也 就 意味 看 客户 闹 必 须 目 行 维护 这 些 标 识 和 从。 每 我 们 在 6.4.2 方 中 
实现 sc_store 模 块 时 再 回 过 头 来 看 这 个 问题 。 

3. gen_server 回 调 段 

sc_element 进 程 启 动 之 后 的 第 一 件 事 就 是 通 过 gen server 回 调子 数 init/1 完 成 进程 初始 化 ， 
有 关 gen server 回 调 的 工作 机 制 请 参阅 3.2.4 节 。 该 函数 应 返回 一 个 初始 化 完毕 的 进程 状态 记录 。 
gen_server:start_link/3 调 用 将 一 直 阻 寨 到 init/1 返 回 为 止 。 src/sc_element.erl 的 各 个 回调 
如 代码 清单 6-5 所 示 : 


代码 清单 6-5 Src/sc_element.erl 中 的 gen_server 回 调 段 


Imnlt([Value，LDeaseTlime]) -> 
Now = calendar:local timet{)}, 
StartTime = calendar:datetime_ to_ gregorian_ seconds (Now) ， 


{ok, 


i#state{value = Value， 




















lease time = LeaseTime, 
start time = StartTime}, 


| 初始 化 进程 状态 


time left'‘iSstartTime, LeaseTime)})}. < 二 一 


二 初始 化 超时 设置 
infinity; 
time left'{(StartTime, LeaseTime}) -> 


NOW = 








calendar: local timet{)}), 


CurrentTime = calendar:datetime to_ gregorian_ seconds (Now), 
TimeElapsed = CurrentTime - StartTime, 
case LeaseTime - TimeElapsed of 


Time when Time =< 0 -> 0; 
Tme -> Time * 1000 


end. 


handle call {fetch, _From, State) -> 
#state{value = Value， 

















lease time = LeaseTime, 
start time = StartTime} = State, 
TimeLeft = time left (StartTime, LeaseTime), 9 取出 进程 状态 中 的 值 
{reply, {ok, Value}, State, TimeLeft}. 
handlje cast{{replace, Value}, State) 一 > 
#state{flease time = LeaseTime, 
start time = StartTime} = State, 
TimeLeft = time left(StartTime, LeaseTime)})., 
{noreply, Statetstate{value = Value}, TimeLeft}.; 
handle cast (delete, State) -> i 
{stop, normal, Statel}. 
henole Jnfo(timeouG, State) 一 > 
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{stop, normal, Statel}. 


terminate!(l Reason, _State}) -> 有 删除 进程 的 键 
sc_store:delete(self(})}), 
OK. 


Code chamnge 1( OldVvsn, State, _Extra) -> 
{ok, State}. 


设置 服务 器 超时 
如 果 忘 了 在 回调 函数 的 返回 值 中 设置 新 的 超时 ， 超 时 将 被 重 置 为 inifinity。 因 此 一 院 
用 上 服务 器 超时 ， 切记 在 每 个 回调 函数 的 每 个 子 句 中 都 设置 好 超时 。 


以 下 是 这 些 回 调 函 数 的 详细 说 明 。 

D ijnit/1 一 一 ijnit/1 函 数 并 不 复 淋 。 该 函数 调用 了 一 组 标准 库 函 数 来 获取 进程 的 启动 时 
间 ， 进 而 将 之 转换 成 了 公历 秒 数 : 也 就 是 按 西方 /国际 公历 计算 ， 自 公元 0 年 〈 即 公元 前 1 
年 ) 至 今 的 秒 数 ， 这 是 一 种 实用 而 统一 的 时 间 表 示 法 。 详 情 请 参见 标准 库 中 calendar 模 块 
的 文档 。 极 数 的 其 余部 分 负责 填写 淘汰 时 间 和 局 劲 时 间 等 服务 器 状态 字段 。 

请 注意 孔 数 所 返回 的 元 组 ， 其 中 第 三 个 元 素 设 置 了 初始 化 完成 后 的 服务 兹 超时 。 你 
应 该 还 记得 ， 在 第 3 草 的 tr_server 中 也 采用 了 同样 的 手法 ， 但 目的 却 有 所 不 同 。 此 处 的 超 
时 用 于 管理 淘汰 时 间 。 你 将 会 看 到 ， 一 个 进程 存储 一 个 值 的 设计 决策 可 以 大 大 简化 淘汰 
时 间 的 管理 ， 实 现 起 来 会 价 单 很 多 。 如 采 服 务 冀 进程 在 淘汰 时 间 到 期 之 前 一 二 无 人 问津 ， 
就 会 收 到 一 条 timeout 消 息 , 该 消息 随即 被 传递 给 handle_info/2 捕 数 ,进而 令 进 程 关闭 。 

工具 师 数 time_left/2 用 于 计算 当前 离 淘 汰 时 间 超 时 还 剩 多 少 室 秒 ， 注 意 系统 采 用 
的 时 间 单 位 是 襄 秒 而 不 是 秒 。 其 中 淘汰 时 间 参 数 既 可 以 是 整数 也 可 以 是 原 于 infinity; 
另外 该 子 数 绝对 不 会 返回 负数 。 

D nandle_call/3:fetch 一 一 调用 fetch/1 API 孙 数 的 日 的 是 获取 一 个 值 ， 因此 应 该 向 服 
务 右 进程 发 起 一 个 同步 的 call 调 用 。 该 调用 最 终 会 传递 至 hand1l e_cal1/3 回 调 果 数 。 

你 只 需要 用 模式 匹配 提取 出 进程 状态 中 的 值 并 将 之 回 传 给 调用 方 人 就 可 以 了 (参见 
fetch/1 返 回 的 元 组 , 其 中 的 {ok, Value} 束 是 ), 唯一 麻烦 的 是 你 还 得 用 局 动 时 间 和 淘汰 
时 间 推 算出 新 的 超时 值 。 至 于 进程 状态 , 原封 不 动 地 返回 给 gen_server 即 可 , 无须 作 任何 
修改 。 

D handle cast/2:replace API 喘 数 replace/2 用 于 更 新 现 有 sc _element 进 程 所 持 有 
的 值 。 这 个 操作 无 须 给 客户 问 应 答 ， 因 而 可 以 使 用 异步 的 cast ,该 调用 最 终 会 转 至 
handle_cast/2。 与 往常 一 样 ， 消 朋 内 附 市 一 个 标记 ， 该 标记 与 发 送 消 息 的 函数 同名 。 
在 创建 具有 复杂 接口 的 服务 硕 时 ， 这 个 简单 的 惯用 法 可 以 为 你 免除 很 多 肪 烦 。 

代码 清单 6-5 中 handq1l e_cast 的 第 一 个 子 句 负 责 理 {replace, Valuel} 消息 6G 这 部 
分 代码 与 fetch 类 似 , 但 这 里 无 顷 提 取 原 有 的 值 , 也 无 须发 送 应 答 ， 只 需 将 用 于 蔡 换 原 值 
的 新 值 存 人 进程 状态 并 返回 给 gen_server 即 可 (有关 记 录 更 新 的 更 多 知识 请 参见 2.11.3 
了 H 训 
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handle cast/2:delete API delete/1 同 样 没有 返回 值 ， 因 此 也 可 以 使 用 cast， 
并 最 终归 结 到 handle_cast/2 的 第 二 个 子 句 。delete 只 需 终 I 上 sc element 进 程 ， 从 而 将 
之 从 绥 存 中 移 除 即 可 。 

请 注意 aelete 和 replace 返 回 的 两 个 元 组 之 间 的 区 别 。 后 者 返回 的 是 norep1y， 表 
示 服 务 右 不 用 发 送 任何 应 容 继 续 运 行 就 好 ， 前 者 返回 的 却 是 stop， 而 这 会 导致 
gen_server 自 行 终止 个 。 进 程 终止 的 原因 被 设 定 为 normal 。 这 个 特殊 值 用 于 通知 OTP 
系统 服务 器 是 正常 关闭 的 : 除非 进程 是 permanent 型 ， 否 则 不 要 进行 重启 ， 也 不 要 在 日 
志 中 记 上 一 笔 非 正常 关闭 。 

DD terminate/2 gen_server 关 闭 时 ， 会 调用 terminate/2 回调 来 执行 一 些 清理 操作 。 
在 这 个 例子 中 ， 你 得 抹 除 与 进程 相关 联 的 键 傅 。 进 程 终 止 时 ， 进 程 状态 也 随 之 消失 ， 然 
而 进程 状态 仅 负 责 值 的 存储 ， 不 负责 维护 键 与 进程 ID 间 的 映射 关系 。 我 们 曾经 担 过 ， 这 
层 映 射 关系 由 sc_store 模 块 人 负责 ， 该 模块 将 在 下 一 小 方 实 现 。 在 此 你 只 需要 调用 
sc_store:delete (Pigd) 即 可 ， 参 数 就 是 即将 关闭 的 这 个 sc element 进 程 的 pid。 

sc_element 及 其 API 困 数 的 实现 就 介绍 完了 ， 总 结 如 下 : 

[start linky2: 

口 create/2 (VRcreate/1); 

LI fetch/1; 























UD replace/2; 

UD delete/1,。 

这 些 函 数 相 互 协 作 ， 共 同 实 现 了 sec_element 进 程 的 数据 存 取 、 检 索 、 更 新 及 删除 功能 。 在 市 
除 操作 中 ， 你 与 se_store 模 块 打 了 一 个 照 面 ， 它 负责 维护 键 与 pid 间 的 映射 关系 ， 我 们 将 在 下 一 市 
介绍 该 模块 的 实现 。 


6.4.2 ”实现 sc_store 模 块 


至 此 , 你 已 经 实现 了 基本 的 应 用 结构 和 缓存 的 后 端 存 储 系统 , 其 中 还 包括 淘汰 时 间 管 理 功 能 。 
现在 ， 你 将 以 此 为 基础 构建 出 一 整套 完整 的 存储 系统 。 目 前 ,所 有 缺失 环节 中 最 关键 的 一 环 就 是 
键 与 进程 标识 符 之 间 的 映射 天 系 〈 如 图 6-5 所 示 )， 有 了 它 你 才能 根据 给 定 的 键 查找 到 相应 的 值 。 
该 映射 的 实现 将 用 到 ETS 表 〈 Erlang Term Storage， 人 参见 2.14 节 )， 随 着 工程 的 深入 ， 我 们 将 陆续 
介绍 有 关 ETS 表 的 各 种 细节 。 

系统 的 其 他 部 分 无 须 关 心 存 储 由 ETS 实 现 的 事实 。sc_store 模 块 扮演 了 一 个 抽象 层 的 角色 ， 
屏蔽 了 实现 键 与 pid 同 映射 关系 的 存储 机 制 。 除了 使 用 ETS, 该 功能 还 可 以 通过 一 个 将 映射 数据 保 
存在 进程 状态 中 的 gen_server 进 程 实现 ; 也 可 以 在 每 次 插入 、 删 除数 据 时 都 将 数据 写 入 的 某 个 位 
盘 文 件 ; 甚至 还 可 以 用 关系 型 数据 库 。 但 无 论 怎样 实现 ,都 应 该 将 应 用 本 喘 从 存储 系统 的 选 型 中 
解 厢 ， 从 而 给 今后 的 改进 方案 留 下 一 些 回旋 余地 。 有 了 这 重 屏 蔽 ,你 甚至 可 以 在 不 修改 其 余 应 用 
代码 的 情况 下 迁移 至 文 持 数据 元 余 的 数据 库存 储 方案 。 

快速 回顾 一 下 第 2 草 中 的 相关 内 容 ，ETS 表 是 用 于 存储 Erlang 数 据 的 高 速 内 存 哈 硕 表 。ETS 用 
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C0 写成， 是 Erlang 运 行 时 系统 ( ERTS ) 的 一 部 分 ， 可 经 由 一 组 内 置 的 Erlang 国 数 访问 。 表 中 的 每 
个 表 项 都 是 一 个 元 组 ， 该 元 组 的 一 个 字段 被 用 作 键 (通常 是 第 一 个 字段 )。ETS 表 尤其 适合 符合 
以 下 条 件 的 数据 存储 需求 : 

口 无 须 在 多 个 虚拟 机 间 共 享 ; 

口 需要 持久 化 ， 且 仅 需 要 在 VM 运 行 期 间 持 久 化 ; 

口 由 VM 内 的 多 个 不 同 进程 共享 ; 

口 访问 速度 要 快 ; 

口 数据 结构 相对 平坦 ， 最 好 不 要 与 其 他 表 有 人 外 键 关系 。 

绥 存 系统 的 存储 需求 正好 与 上 述 条 件 相符 : 前 文 所 述 的 映射 关系 需要 在 绥 存 服务 运行 期 间 持 
和 久 化 ，VM 关 闭 后 则 不 再 必要 ， 这 些 数据 也 不 需要 在 多 个 VM 间 共 吝 ;进程 之 间 需 要 共享 数据 表 :; 
数据 谈 取 速度 要 快 ， 因 为 查询 操作 位 于 缓存 服务 的 关键 路 径 上 ; 男 外 数据 本 里 的 结构 也 很 局 平 ， 
并 且 与 其 他 表 无 关 。 本 质 上 它 就 是 一 张 由 一 对 对 的 键 和 进程 标识 符 组 成 的 数据 表 。 

代码 清单 6-6 展 示 了 src/sc_ store.erl 的 代码 。 这 一 次 ,这 个 模块 没有 采用 任何 OTP 行 为 模式 , 也 没 
有 与 任何 进程 相关 联 一 一 它 只 包含 一 组 供 其 他 进程 调用 的 库 函 数 。( 不 过 后 续 还 会 有 所 变化 。) 


代码 清单 6-6 src/sc store.erl 


-modulelsc store). 





























-export(l[ 
init/0, 
insert/2, 
delete/1, 
Jookup/1 
os 


-define (TABLE ID, ?MODULE). 

1nit{} 一 > 
ets:new(?TABLE_ID, [public, named tablel]), 
ok. 

insert{Key, Pid) -> 
ets:insert (?TABLE ID, {Key, Pid}). 


lookup (Key) 一 > 
case ets: lookup{?TABLE ID, Key) of 
[{Key, Pid}] -> {ok, Pid}:; 
[] -> {error, not_found} 
end. 














delete{Pid) -> 
ets:match delete(?TABLE ID, {' ', Pid})}). 


API 由 init/1 (负责 存储 系统 的 初始 化 ) 和 处 理 基 本 CRUD 操 作 ( 创建、 读 取 、 更 新 和 删除 ) 
的 3 个 函数 组 成 , 其 中 ijnsert/2 同 时 负责 创建 新 表 项 和 更 新 现存 表 项 。 这 几 个 函数 的 实现 都 很 简 
洁 。 我 们 先 来 看 看 初始 化 。 

1. 存储 的 初始 化 

在 init/1 中 ， 痢 先 需 要 创建 用 于 存放 映 冉 关系 的 ETS 表 。 很 简单 : 直接 调用 ets :new/2 即 可 。 
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需要 访问 这 张 表 的 进程 很 多 ， 因 此 应 该 将 它 标 为 public; 同时 ， 为 了 让 进程 能 便捷 地 找到 这 张 表 ， 
还 应 该 将 它 标 为 named table( 具名 表 )。 表 名 由 TABLE_ID 安 指定 , 在 此 该 宏 被 定义 为 模块 名 ( sc_store )。 


要 事 优先 
按 惯例 ， 初 始 化 函数 或 启动 函数 应 该 摆 在 API 部 分 的 首位 。( 其 他 模块 中 的 start_1l1ink 
和 init 函数 同样 享有 这 个 待遇 。) 遵循 这 类 惯例 有 助 于 提高 模块 的 可 读 性 。 


访问 ETS 表 的 方法 有 两 种 。 第 一 种 ,同时 也 是 最 常用 的 一 种 ， 是 利用 ets :new/2 冰 数 返回 的 表 
句柄 。 正 如 pid 可 以 唯一 标识 一 个 进程 ， 该 句柄 也 可 以 唯一 标识 一 张 表 。 第 二 种 方法 是 利用 表 名 。 
ETS 接 口 要 求 每 张 表 都 有 一 个 名 字 ; 但 必须 先 设置 named table 才 能 用 表 名 来 访问 表 ， 此 外 ， 多 张 表 
可 以 共用 一 个 表 名 。 在 此 采用 具名 表 的 原因 在 于 我 们 不 而 望 库 的 用 户 去 奶 踩 表 句 柄 一 一 一 旦 这 样 
做 , 你 就 必须 将 句柄 传递 给 所 有 会 用 到 sc _store 的 进程 , 而 且 sc_store 的 每 个 API 凋 用 部 必须 包含 该 
句柄 。 

现在 问题 来 了 : 该 在 哪儿 调用 sc_store:init/0 呢 ? 好 好 想 想 。 其 实 无 非 两 条 路 : 要 么 在 
应 用 行为 模式 模块 sc_app 中 调用 ， 要 么 在 根 监 督 者 sc_sup 中 调用 。 前 面 曾经 讲 过 ， 监 督 者 应 当 简 
短 可 徘 ,，Erlang/OTP 的 设计 原则 之 一 就 是 尽量 不 要 在 监督 者 模块 中 插入 应 用 代码 。 仪 在 顶层 监督 
者 的 init/1 函 数 中 插入 少量 代码 问题 还 不 大 ， 因 为 一 旦 出 了 什么 乱 子 ， 整 个 应 用 都 无 法 启动 ”。 
但 从 原则 上 讲 ， 这 种 做 法 仍然 不 受 欢迎 ; 与 其 这 么 做 , 我 们 宁可 将 初始 化 代码 放 到 应 用 行为 模式 
文件 中 去 。 修 改 src/sc app.erl 中 的 start/2 困 数 如 下 : 


start{( StartType, _StartArgs}) -> 
sc store:1init!{), < 
dE Bt Suuntoart Tiki of 存储 初始 化 
{ok, Pid} -> l 
{ok, Pid}; 
Other -> 
{error, Other)} 


















































Old. 


只 要 加 上 这 么 一 句 ，sc_store 便 可 以 在 应 用 局 动 后 的 第 一 时 间 完 成 初始 化 。 如 末 再 延迟 初 始 
化 的 时 机 ( 例如 放 在 顶层 监督 者 局 动 之 后 )， 就 有 可 能 在 菏 些 地 方 出 现 试 图 访问 某 张 尚 不 存在 的 











ETS 表 的 风险 。 
接 下 来 要 处 理 的 就 是 映射 关系 的 存储 , 解决 了 这 个 问题 才能 通过 给 定 的 键 从 映射 关系 中 求 得 
对 应 的 pid。 


2. 表 项 的 创建 和 更 新 

代码 清单 6-6 中 的 sc_store:insert/2 以 表 名 为 标识 从 单 地 通过 调用 ets : jnsert/2 同 时 
实现 了 新 映射 关系 的 插入 和 现 有 映射 关系 的 更 新 。 如 2.14.2 节 所 述 ，ets:insert/2 的 第 二 个 参 
数 必 须 是 一 个 元 组 。 默 认 情 况 下 , 表 中 所 有 元 组 的 第 一 个 元 素 被 视 作 键 , 其 余 元 和 素 被 视 作 载 入 ( 个 
数 任意 )。 按键 进行 查找 时 , 与 该 键 对 应 的 整个 元 组 都 将 被 返回 。ETS 默 认 表 现 为 一 个 集合 (set ) : 
同一 时 刻 一 个 键 只 能 与 一 个 表 项 相对 应 ， 如 末 表 中 现 有 的 某 个 表 项 与 插入 的 新 元 组 具有 相同 的 




















中 言 下 之 意 是 这 种 做 法 不 会 导致 运行 时 难以 发 现 的 问题 。 一 一 译 者 注 
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键 ， 那 么 旧 表 项 将 被 新 元 组 复 善 一 一 这 恰恰 是 你 所 需要 的 功能 。 

请 注意 该 函数 不 会 对 数据 类 型 做 任何 检查 ; 它 才 不 关心 你 插入 的 是 pid 还 是 别 的 什么 东西 。 
些 都 是 内 部 代码 ， 它 们 对 调用 者 持 完 全 信任 态度 。 最 终 执行 插入 操作 的 代码 都 得 由 你 来 编写 。 
应 该 在 系统 的 边界 处 执行 有 效 性 检查 ,之 后 便 再 无 公 要 了。 如 采 某 处 潜藏 着 什么 问题 ， 就 应 该 
过 测试 来 发 现 它 。 这 种 思想 可 以 让 你 的 代码 保持 整洁 ， 同 时 也 更 易于 维护 。 

现在 你 已 经 可 以 插入 数据 了 ， 下 面 我 们 还 要 再 把 它 查 出 来 。 

3. 数据 读 取 

对 于 集合 型 ( 默认 类 型 ) ETS 表 ， 由 于 内 部 采用 哈 希 表 实 现 ， 按 键 查 询 操作 是 个 速度 很 快 的 
常数 时 间 操 作 。 如 2.14.2 节 所 述 ，ets :1ookup/2 的 返回 值 是 一 个 列表 ， 其 中 包含 了 表 中 含有 该 
键 的 所 有 元 组 。 我 们 使 用 的 正 是 集合 型 表 ， 因 此 结果 中 要 么 只 有 一 个 元 组 要 么 一 个 都 没有 ,参见 
代码 清单 6-6 中 的 lookup/1 孙 数 。 

找到 指定 的 键 所 对 应 的 表 项 之 后 ， 先 将 ETS 返 回 的 值 转换 成 更 顺眼 的 tok，Pid} 再 返回 。 如 
果 表 中 没有 这 个 键 ， 则 直接 返回 {ferror，not_found}。 这 也 是 一 种 封装 : 对 于 函数 的 调用 者 而 
言 ,底层 基于 ETS 的 实现 既 不 可 见 也 不 关键 ,那么 目 然 也 没有 理由 将 ETS 的 返回 人 二 接 双 露 给 外 界 。 

剩 下 的 唯一 操作 丈 是 表 项 的 删除 了 。 虽 然 仅 有 一 行 代码 , 但 我 们 有 必要 对 该 操作 的 实现 作 一 
些 解释 。 

4. 利用 模式 匹配 删除 表 项 

现在 的 问题 是 我 们 更 希望 按 值 ( 进程 标识 符 ) 而 不 是 按键 来 删除 表 项 。 这 样 做 可 以 大 大 简化 
6.4.1 季 (代码 清单 6-$ ) 中 sc_element:terminate/2 困 数 的 实现 ， 进程 退出 时 , 它 只 需要 轻 描 
洗 写 地 说 一 句 :“ 请 把 和 我 相关 的 表 项 从 表 中 删除 。 请 注意 ,我 们 的 代码 在 结构 上 保证 了 键 与 进 
程 之 间 一 定 是 一 一 映射 关系 。 解决 这 个 问题 的 方法 有 几 种 。 你 可 以 为 行 维 护 一 张 倒 排 表 ; 先 查 出 
与 指定 pid 对 应 的 键 ， 再 根据 这 个 键 去 删除 表 项 ， 但 这 样 一 来 代码 量 会 翻 倍 ， 而 且 每 次 插入 、 删 
除 都 会 引发 两 次 写 操 作 ， 此 前 则 只 需要 一 次 。 此 外 ,你 也 可 以 过 历 整 张 表 ， 拨 个 儿 检 查 每 个 键 所 
对 应 的 值 , 直到 找到 特定 的 pid 为 止 , 可 这 太 慢 了 (但 在 删除 操作 的 频率 足够 低 时 仍然 可 以 接受 )。 
然而 ETS 还 有 一 个 强大 的 机 制 ， 无 须 逐 一 检查 所 有 表 项 ， 只 需 利 用 模式 匹配 进行 全 表 搜 索 即 可 。 
这 种 方法 本 质 上 仍然 是 全 表 扫 描 ， 但 速度 却 很 快 ， 因 为 整个 扫描 过 程 完全 是 用 C 实 现 的 ， 极 力 避 
免 了 无 谓 的 数据 复制 。 

一 般 来 说 ， 代 码 清单 6-6 中 delete/1 函 数 的 使 用 频率 要 低 于 insert/2 操 作 ， 甚 至 比 
lookup/1 更 要 低 ， 如 此 看 玉 当 前 这 个 实现 也 就 够 用 了 (今后 如 有 果 有 加 速 的 必要 可 以 再 加 上 倒 排 
表 )。 前 文 所 述 的 扫描 过 程 是 通过 ets :match_delete/? 实 现 的 ， 其 中 {'_' ,Pid} 为 匹配 模式 。 
扁 幅 所 限 ， 在 此 无 法 详 述 ETS 的 模式 匹配 。 针 对 ETS 匹 配 函 数 的 完整 解释 超出 了 本 书 的 范 胃 ， 这 
些 也 数 的 功能 着 实 强 大 ， 我 们 建议 你 参阅 Erlang/OTP 文 档 来 了 解 详情 。 

删除 操作 采用 的 模式 是 {'_' ,Pid}。 该 模式 可 以 匹配 所 有 第 二 个 元 率 为 指定 进程 ID 的 二 元 
组 。 配 合 ests:match_delete/2 了 为数 一 同 使 用 该 模式 ， 便 可 以 删除 表 中 所 有 匹配 的 表 项 〈 表 中 
最 多 只 有 一 个 符合 条 件 的 表 项 )。 轻 松 搞定 ! 
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匹配 模式 

这 些 模式 都 以 Erlang 项 式 表 示 ， 其 内 容 组 成 可 分 为 3 种 : 

口 普 通 的 Erlang 项 式 和 已 绑 定 的 变量 ; 

口 单 引 号 内 的 下 划 线 原子 ('_' )。 其 含义 与 普通 Erlang 模式 中 的 下 划 线 相同 

略 模 式 或 通配符 ; 

口 形 如 ' $S<integer>' 的 模式 变量 (如 Sl1、$2、$3…)。 

举 个 例子 ,， 元 组 {erlang,number,1} 可 由 模式 {erlang,' ' ,1} 匹 配 。 通 配 符 ' ' 表 示 
你 不 关心 这 个 位 置 上 有 什么 东西 ,该 模式 可 以 匹配 所 有 第 一 个 元 素 为 erlang 且 最 后 一 个 元 素 
为 1 的 三 元 组 。 利 用 模式 变量 。 你 还 可 以 选择 性 地 提取 与 模式 相 匹配 的 元 组 中 的 值 。 例 如 , (对 
于 上 述 的 同一 个 元 组 ) 模式 {'$2','$1','_"') 将 得 到 列表 [number，erlang] ， 这 个 结 采 由 
元 组 中 各 字段 的 排列 顺序 决定 ,而 且 模 式 变 量 的 返回 次 序 总 是 与 它们 的 编号 保持 一 致 。 详 情 请 
参见 ets:match/2 的 文档 。 


这 样 一 来 sc_store 模 块 也 完工 了 。 用 于 处 理 键 与 pid 间 映 喘 关 系 的 所 有 操作 ， 外 加 初始 化 ， 宛 
已 齐备 。 在 实现 过 程 中 ， 你 进行 了 抽象 ， 对 应 用 的 其 余部 分 屏蔽 了 底层 的 实现 〈 也 就 是 对 ETS 表 
的 使 用 ) 大功告成 之 前 还 剩 下 一 件 事 儿 : 创建 一 套 可 用 作 应 用 前 端的 用 户 API。 


6.4.3 打造 应 用 层 API 模 块 


应 用 层 API 模 块 通 稼 与 应 用 同名 。( 请 注意 ， 第 4 章 中 的 服务 需 应 用 无 顷 API。) 在 此 ， 你 将 为 
simple _ cache 应 用 建立 一 个 名 为 Simple_ cache 的 API 模 块 。 该 模块 为 缓存 服务 的 终端 用 户 提 供 了 以 
下 接口 函数 : 

D insert/2 一 一 将 键 / 信 对 人 存 人 组 存 ; 

UD lookup/ 1 一 一 按键 查询 值 ; 

口 delete/1 一 一 按键 从 绥 存 中 删除 键 / 值 对 。 

这 套 API 并 未 包含 应 用 的 启动 、 停 止 功 能 ， 相 关 功 能 将 交 由 application:start/1 等 系统 
函数 来 处 理 ， 详 细 内 容 参 见 4.3 节 。 代 码 清 单 6-7 中 罗列 了 上 述 函 数 ， 集 成 了 本 章 业 已 创建 的 所 有 
功能 。 
代码 清单 6-7 src/simple cache.erl 


-module (simple cache). 





用 作 省 


























-export([insert/2, lookup/1, delete/1]). 


insert (Key, Value) -> 
CaSse ScC_ store:lookup(Key) of 
{ok, Pid} -> 
sc element:replace{Pid, Value): 
{error, _} -> 
{ok, Pid} = sc element:create{Value), 


9 


sc Store:insert (Key, Pigd) 


图 灵 社 区 会 员 for(;;)(13433955876@163.com) 专 享 尊重 版 权 


6.4 从 应 用 骨架 到 五 脏 俱全 的 缓存 143 


lookup (Key) 一 > 
try 
{ok, Pid} = sc store: lookup {Key), » 获取 与 键 相 对 应 的 pid 
{ok, Value} = sc element:fetch (Pid), 


{ok, Value} 
catch 
_Class:_Exception -> 
{error, not_found} 
end. 


QeleteKey) -> 
Case sc_ store: lookup (Key) of 





(ok, Eid} =% 9 清理 
sc_element:delete (Pid): 
{error, _Reason)} 一 > 
Ok 
end. 


以 下 是 对 这 些 API 了 本数 的 详细 介绍 。 

D simple_cache:insert/2 一 一 该 函数 负责 将 参数 中 的 键 / 值 对 存 人 缓存 。 为 此 ， 你 需要 
先 调用 sc_store:1lookup/1 以 判断 表 中 是 否 已 经 存 有 和 该 键 相对 应 的 表 项 人 @。 如 果 表 项 
已 存在 ， 可 以 调用 sc_element :replace/2 图 数 用 新 值 奉 换 现 有 的 存储 元 素 。 如 有 果 还 没 
有 与 该 键 对 应 的 表 项 , 你 就 必须 创建 一 个 新 的 sc_element 进 程 来 存储 键 / 值 对 的 值 , 并 将 键 
与 进程 ID 间 的 映射 关系 存 人 sc _store。 请 注意 ,日 前 为 止 你 的 API 尚 未 提供 设置 淘汰 时 间 
的 功能 ， 仅 文 持 长 达 一 天 的 默认 淘汰 时 间 。 要 添加 该 功能 也 很 简单 ， 只 需 再 增加 一 个 参 
数 即 可 (出 于 癌 下 莘 容 性 考虑 ， 还 应 提供 一 个 支持 默认 淘汰 时 间 的 版 本 )。 

U simple cache: lookup/ 1 一 -一 查询 功能 的 实现 很 百 接 用 sc_store :lookup/ 1 按 指 定 
的 键 查找 对 应 的 pid; 如 果 找 得 到 ， 就 向 对 应 的 sec_element 进 程 查 询 它 所 持 有 的 值 @。 其 他 
情况 下 ( 键 不 存在 ， 或 进程 于 应 答 前 终止 ) 都 返回 {ferror，not_found}。 几 是 遇 到 这 
种 需要 依次 执行 一 连 吕 动作， 且 任 一 步骤 失败 后 都 应 返回 相同 结果 的 情况 ， 就 应 该 使 用 
try 表达 式 。(try/catch 相 关 详 情 请 参见 2.8 节 。) 

D simple cache:delete/ 1 一 一 与 insert/2 困 数 一 样 ， 删 除 指 定 的 键 所 对 应 的 表 项 之 前 
也 需要 调用 sc_store:1lookup/1 查 找 该 键 是 否 已 经 存在 。 如 采 不 存在 ,直接 返回 ok 即 可 。 
否则 ， 将 删除 操作 委托 给 sc_element:delete/1 全 ,该 隐 数 将 进一步 调用 
sc store:delete/1 ( 参见 代码 清单 6-5 中 实现 的 sc element:terminate/2 总 全 
sc_element 目 己 清 理 目 己 的 好 处 在 于 ， 无 论 元 素 出 于 怎样 的 原因 被 移出 ， 绥 人 存 都 可 以 确保 
清理 操作 的 执行 一 一 尤其 是 淘汰 时 间 过 期 ， 或 是 某 个 bug 触 发 了 sc_element 的 异常 导致 进 
程 意外 退出 。 

搞定 ! 你 的 简易 缓存 终于 打造 完毕 可 以 运作 了 。 下 面 我 们 来 尝试 一 下 ( 强烈 建议 你 亲 目 动手 )。 

试 运行 之 前 ， 请 按 4.3 记 中 的 指示 编译 src 目 录 下 的 所 有 模块 ， 并 将 生成 的 ,beam 文件 悉 数 放 到 ebin 
目录 下 。 然 后 请 按 下 述 指示 《〈 在 应 用 根 目录 下 ) 运行 Erlang， 启 动 应 用 : 
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S erl -pa ebin 


Eshell V5.5.5 {abort with ^Q) 

1> application:start (simple cache) . 
OK 

2> 


试 一 试 你 刚刚 写 好 的 3 个 simple_cache API 申 数 。 现 在 你 应 该 可 以 将 任意 类 型 的 键 值 对 存 人 组 
存 。 进 行 实验 时 ， 你 可 以 将 src/sc_ element.erl (参见 代码 清单 6-3 ) 中 的 默认 淘汰 时 间 改 短 些 ， 比 
如 改 成 60 秒 ， 以 便 确 认 淘 汰 时 间 过 期 后 表 项 确实 会 日 行 淘汰 。( 改 完 代码 后 不 要 蕊 记 重 新 编译 模 
块 并 替换 ebin 下 的 .beam 文 件 。) 








6.5 小结 


本 章 你 打造 了 一 套 绥 存 服务 , 尽管 我 们 对 整个 实现 过 程 作 出 了 详尽 的 解释 , 但 反观 你 所 编写 
的 这 几 行 代码 , 你 会 发 现 其 实 很 简单 。 这 个 绥 存 市 有 我 们 所 期 望 的 CRUD 功 能 , 完全 驻 留 于 内 存 ， 
甚至 还 带 有 基于 淘汰 时 间 的 旧 数 据 项 目 动 淘汰 策略 。 本 章 活 用 了 不 少 概 念 , 把 本 书 第 一 部 分 讲 过 
的 内 容 用 了 个 遍 。 

从 基本 的 设计 开始 , 你 首先 搭建 了 应 用 框架 和 应 用 行为 模式 模块 。 接着 又 实现 了 顶层 监督 者 
sc_sup， 该 监督 者 采用 的 监督 贫 略 有 别 于 本 书 第 一 部 分 曾 展 示 过 的 策略 它 的 行为 更 类 似 于 一 个 
工作 进程 工 三。 应 用 上 骨架 就 绪 后 ， 你 又 动手 创建 了 用 于 存储 元 素 值 和 处理 淘汰 时 间 的 sc_element 
模块 、 用 于 处 理 键 与 pid 间 映射 关系 的 sc_ store 模块 ， 以 及 整合 了 各 个 模块 的 应 用 API 模 块 
simple _ cache。 

现在 你 应 该 已 经 了 解 了 OTP 应 用 的 创建 方法 ， 也 明白 了 应 该 如 何 封 装 协议 、 如 何 管理 状态 、 
如 何 将 程序 组 织 成 OTP 组 件 ， 以 及 如 何 编写 简洁 可 旋 的 模块 。 从 现在 开始 ， 我 们 将 进一步 钻研 
Erlang/OTP 中 的 各 种 技术 , 进一步 完善 你 的 缓存 应 用 一 一 就 当前 的 程度 而 言 ，Erlware 的 开发 者 认 
为 它 还 无 法 胜任 站 点 加 速 的 任务 。 从 根本 上 说 , 它 还 没有 达到 上 线 标准 : 一 旦 发 生 什 么 线 上 问题 ， 
你 会 手足 无 措 一 一 我 们 连 最 基本 的 日 志 都 没有 。 另 外 ， 监 控 和 事件 处 理 也 还 没有 纳入 考虑 范畴 ， 
除非 人 工 进 行 检测 , 否则 你 无 从 知晓 绥 存 服务 的 死活 。 别 着 急 , 这 些 问 题 都 将 在 下 一 草 得 到 解决 。 


















































图 灵 社 区 会 员 for(;;)(13433955876@163.com) 专 享 尊重 版 权 





Erlang/OTP 中 的 日 志和 
事件 处 理 


本 章 概要 

口 Erlang/OTP 的 日 志 功 能 和 SASL 应 用 
口 事件 处 理 和 gen_event 行 为 模式 

口 创建 自 定 义 事件 流 


在 上 一 章 中 你 搭建 了 一 套 短小 精干 的 缓存 应 用 。 该 应 用 支持 键 / 值 对 的 存储 和 快速 查询 ， 其 
至 还 可 以 自动 淘汰 老 旧 数据 项 。 多 种 进程 、 监 督 者 和 数据 表 相 互 配 合 , 优雅 而 简洁 地 实现 了 这 些 
功能 。 该 应 用 不 仅 实现 得 干净 利落 ， 功 能 也 毫 不 示弱 : 应 用 及 监督 者 的 启动 、 来 来 往往 的 工作 进 
程 、 数 据 的 存 取 、 淘 汰 时 间 的 超时 机 制 , 还 有 针对 数据 表 的 各 种 操作 ， 一 应 俱全 。 但 从 应 用 用 户 
的 角度 出 发 ， 这些 都 是 发 生 在 应 用 底层 的 活动 ， 难 以 被 用 户 感 知 。 比 如 ， 要 想 统计 最 近 一 小 时 内 
处 理 了 多 少 次 数据 插入 请 求 ， 你 就 无 能 为 力 了 。 更 要 命 的 是 , 一 旦 发 生 了 什么 故障 ,你 连 查 都 没 
法 儿 查 。 

在 这 一 章 ,， 我 们 将 向 你 介绍 事件 处 理 的 概念 。 系 统 中 总 会 不 断 涌现 出 各 种 事件 ,为 了 处 理 这 
些 事件 ，Erlang/OTP 专 门 提供 了 一 套 框 架 。 通 过 该 框架 你 可 以 自行 创建 事件 流 ， 还 可 以 往 系统 中 
挂 接 各 种 事件 处 理 需 来 响应 系统 中 产生 的 事件 。 这 套 框 架 是 标准 OTP 日 志 系 统 的 基础 。 我 们 将 向 
你 展示 这 套 系 统 的 使 用 方法 , 以 及 如 何 通过 自 定 义 事 件 处 理 需 来 调整 这 套 系 统 的 行为 。 我 们 还 会 
问 你 展示 如 何 创 建 自 定 义 的 应 用 级 事件 流 , 这 种 手法 可 以 为 你 的 用 户 打 开 一 扇 门 ， 让 他 们 得 以 在 
你 的 系统 中 挂 接 自己 的 逻辑 。 本 章 将 涵盖 以 下 主题 : 

口 日 志 系 统 ; 

口 事件 处 理 以 及 如 何在 日 志 系统 中 挂 接 自 定义 处 理 器 ; 

口 自 定 义 事件 的 创建 和 处 理 。 

现在 请 考虑 一 个 问题 :“Simple Cache 的 内 部 出 现 故障 时 该 怎么 办 ? ” 抱 着 这 个 问题 ,我 们 来 
谈 一 谈 OTP 的 日 志 系 统 。 
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7.1 Erlang/OTP 中 的 日 志 


Simple Cache 真 要 是 在 运行 过 程 中 出 了 什么 故障 该 怎么 办 呢 ? 就 当前 的 设计 来 看 , 除非 服务 整 
个 天 洗 ， 和 否则 你 可 能 根本 无 法 察觉 有 任何 异常 。' 比如 , 在 我 们 的 设计 中 ， 元 系 存 储 进 程 在 退出 时 
会 目 行 进行 清理 ， 而 由 于 工作 进程 被 设置 成 temporary 型 ， 监 督 者 此 时 是 不 会 作出 任何 反应 的 。) 

这 套 缓 存 服务 不 能 再 这 样 沉默 下 去 了 了，Erlang/OTP 自 市 的 精良 装备 可 以 很 好 地 解决 这 个 问 
题 。 这 些 装 备 就 是 日 志 应 用 、SASL 应 用 ， 以 及 由 gen_event 行 为 模式 提供 的 事件 处 理 框架 。 它 
们 共同 构成 了 一 整套 强大 的 用 于 与 外 界 进行 各 种 信息 交换 的 工具 。 利用 gen_event, 你 还 可 以 让 
其 他 应 用 接 入 你 的 系统 。 
































此 SASL 非 彼 SASL 

你 也 许 知 道 ,在 网 络 协议 中 有 一 种 通用 授权 协议 框架 也 叫 SASL。 但 Erlang/OTP 中 的 SASL 
应 用 与 此 风 马 牛 不 相 及 ( 早 在 RFC 2222 撰 成 之 前 它 就 叫 这 个 名 字 了 )。 在 此 ， 它 表示 的 是 身 
为 Erlang/OTP 五 大 基础 应 用 (erts\kernel\stdlib sas1 和 compiler ) 之 一 的 系统 架构 支撑 库 ( System 
Architecture Support Libraries )。 这 五 大 应 用 是 Erlang/OTP 其 他 部 分 的 基石 。 其 中 SASL 应 用 由 
若干 用 于 系统 管理 的 重要 服务 构成 。 








在 本 董 的 后 续 部 分 我 们 还 会 回 到 SASL 和 gen_event 的 话题 。 现 在 ， 我 们 不 妨 先 对 日 志 系 统 
做 一 个 初步 的 了 解 。 


7.1.1 日 志 概 述 


Log4j 等 日 志 系 统 〈 或 是 log4c、log4r 等 ) 你 多 半 用 过 。 在 各 种 软件 开发 工具 中 ， 日 志 的 地 位 十 
分 显赫 ， 几 乎 所 有 编程 语言 都 提供 了 一 套 适 用 于 该 语言 的 、 可 视 为 事实 标准 的 日 志 系 统 。 日 志 系 统 
一 般 都 设 有 多 个 严重 级 别 ， 用 于 区 分 日 志 的 重要 程度 。 日 志 级 别 通常 可 分 为 五 个 ,分 别 是 : critical 
(或 severe )、error、warning、info 和 debug。 确 切 名 称 可 能 依 系统 的 不 同 而 不 同 。 这 儿 个 级 别 的 含义 
都 显而易见 ， 但 每 个 级 别 的 使 用 场合 却 没 那么 容易 区 分 ， 针 对 这 个 问题 ， 我 们 简单 做 一 个 总 结 。 
口 critical 或 severe 一 一 表示 系统 遭遇 了 灾难 性 故障 或 者 客户 已 无 法 访问 系统 ， 此 时 应 立即 采 
取 人 工 措 施 。 使 用 这 个 级 别 时 应 慎之 又 慎 ， 只 有 那 种 有 必要 在 姿 晨 三 点 把 人 从 床上 拖 起 
来 的 紧急 情况 才 用 得 上 这 个 级 别 的 日 志 。 
D error 一 一 告知 系统 运 维 人 员 系 统 中 出 现 了 一 些 不 恨 状况 ,但 并 不 严重 。 例 如 ， 某 个 子 系统 
有 骨 尝 后 重启 了 一 次 , 或 是 菜 个 客户 会 话 因数 据 错 误 而 被 中 断 。 这 类 问题 理应 立即 得 到 修复 ， 
不 过 拖 到 明天 再 处 理 也 无 伤 大 雅 。 不 要 洲 用 这 个 级 别 ， 否 则 人 们 会 逐渐 忽略 这 些 消息 。 
口 wamn 一 一 告知 运 维 人 员 系 统 中 出 现 了 某 些 潜在 的 负面 问题 ， 但 暂时 无 害 。 你 可 以 选择 忽 
上 略 这 个 级 别 的 问题 ， 或 是 暂时 绕 过 留待 日 后 修复 ， 以 免 捅 出 别 的 什么 秋子 或 是 给 系统 平 
添 不 必要 的 负载 。 
D info 一 一 表示 一 条 通告 性 消息 ， 用 于 将 某 个 事件 的 发 生 告知 给 运 维 人 员 。 这 类 事件 可 能 是 
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好 消息 ， 比 如 “备份 任务 完成 "; 也 可 能 有 那么 点 儿 令 人 诅 兹 ， 比 如 “邮件 发 送 失 败 ， 五 
分 钟 后 重 试 ”。 这 个 级 别 可 以 随便 用 ， 但 也 别 太 离谱 ， 以 免 把 你 的 运 维 团队 济 没 在 各 种 室 
无 用 途 的 细节 之 中 。 

口 debug 一 一 提供 各 种 巨细 信息 。 这 个 级 别 基本 上 是 给 号 为 开发 者 的 你 准备 的 ， 用 于 协助 调 

试 运 行 中 的 系统 ,( 在 一 定 限度 内 ) debug 日 志 总 是 越 多 起 好。 除非 有 人 明确 地 要 求 ， 否 
则 一 般 是 不 输出 debug 消 息 的 。 

大 多 数 日 志 系 统 都 允许 运 维 人 员 根 据 具体 情况 设置 一 个 最 低 严 重 级 别 。 如 果 想 要 把 控 一 切 ， 
就 调 到 debug 级 别 , 在 该 级 别 下 你 可 以 看 到 所 有 类 型 的 消息 。 如 采 硕 望 看 到 除 debug 消 息 以 外 的 所 
有 消息 ， 就 调 到 info 级 别 。 如 条 仅 硕 望 在 发 现 问题 时 得 到 通知 ， 则 可 以 调 到 warn 级 别 ， 以 此 类 推 。 

日 志 系 统 还 提供 了 一 些 其 他 功能 ， 比 如 调整 输出 格式 ,给 日 志 消 息 添 加 时 间 惟 等 。 暂 且 不 去 
关注 这 些 细 蔬 ， 我 们 先 来 看 看 Erlang/OTP 的 日 志 功 能 是 怎样 运作 的 。 




















7.1.2 Erlang/OTP 内 置 的 日 志 设 施 


日 志 是 个 极为 名 用 的 系统 需求 ，Erlang/OTP 的 基本 发 行 版 便 提 供 了 日 志 功 能 文 持 。 其 主要 功 
能 由 标准 库 中 kernel 应 用 的 error_logger 模 块 提供 , 供 OTP 行 为 模式 使 用 的 扩展 日 志 功 能 则 由 SASL 
应 用 提供 。 它 不 仅 提 供 了 输出 日 志 的 方法 , 还 给 出 了 一 侄 用 于 实现 日 定义 日 志和 事件 处 理 的 通用 
框 染 。 

OTP 的 先 认 日 志 格 式 比 较 吝 怪 ， 和 用 的 日 志 解 析 工 具 都 拿 它 没 办 法 。 因 此 你 必须 权衡 是 否 选 
用 原生 的 日 志 系 统 ， 如 采 你 的 系统 需要 融入 现 有 的 非 Erlang 的 基础 架构 ， 那 么 可 能 不 应 该 选用 其 
他 的 日 志 系 统 ; 如 条 是 要 基于 OTP 创 建 全 新 的 系统 ， 情 况 则 相反 。 同 时 ， 你 也 应 当 明 了 在 选择 外 
部 日 志 系 统 时 需要 做 出 哪些 妥协 。 为 了 做 到 知己 知 彼 ， 让 我 们 先 来 看 看 日 志 系 统 的 主要 API。 











7.1.3 标准 日 志 函 数 


用 于 投递 日 志 消 息 的 标准 API 比 较 人 简单 , 但 该 API 仅 文 持 3 个 日 志 级 别 : error、warning 和 info。 
很 快 你 便 会 发 现 , 这 根本 算 不 上 什么 限制 ,因为 报告 类 型 和 事件 处 理 融 都 可 以 目 行 添加 。 不 过 对 
于 初学 者 而 言 , 还 是 先 将 就 一 下 吧 。 日 志 投 递 相关 的 API 也 数 可 以 在 error logger 模 块 (位 于 kernel 
应 用 中 ) 中 找到 。 以 下 是 最 基本 的 几 个 水 数 : 








error logger:error msg (Format}) -> ok. 

error_ logger:error msg (Format, Data) -> ok. 
error_logger:warning_msg (Format} -> ok 
error_logger:warning_msg (Format, Data) -> ok. 
error logger:info msg (Format} -> ok. 

error logger:info msg (Format, Data}) -> ok. 


这 几 个 函数 的 接口 与 标准 库 果 数 io :format/1 和 io:format/2 相 同 (参见 2.$.1 贡 ): 第 一 个 
参数 是 格式 字符 串 ， 其 中 可 以 包含 由 波浪 号 (~ ) 开头 的 转 义 码 ， 如 ~w， 第 二 个 参数 则 是 与 转 义 
但 对 应 的 值 的 列表 。 
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我 们 先 来 打印 几 条 日 志 看 看 。 使 用 下 列 方法 你 可 以 通 六 过 调用 info _msg/1 来 输出 简单 字符 串 : 





2> error logger:info msg{("This is a message~n"). 
=INFO REPORT==== 4-Apr-2009::14:35:47 === 

This is a message 

OkK 














这 样 便 癌 日 志 记 录 融 发 送 了 一 条 info 消 息 ， 日 志 记 录 融 会 对 该 消息 进行 格式 化 ， 并 给 它 加 上 
一 个 舍 有 产 重 级 别 和 时 间 惟 的 标题 。 殉 认 情 况 下 ,日 志 消 息 是 二 接 输 出 ， 你 也 可 以 对 系 
统 进 行 配置 ， 将 日 志 输 出 到 文件 或 将 日 志 关闭 。( 示例 中 的 ok 是 函数 调用 返回 给 shell 的 返回 值 ， 
并 非 消息 的 一 部 分 。) 

使 用 info_msg/2 可 以 在 日 志 消 息 中 挫 入 数据 : 




















3> error logger:info msg('"This is an ~s message~n", ["info"]}. 
=INFO REPORT==== 4-Apr-2009::14:39:23 === 

This is an info message 

OkK 


转 义 个 ~s 用 于 在 格式 字符 串 中 插入 其 他 字符 串 。 有 关 格 式 字 符 串 的 详情 请 参阅 io: 
format /2 的 文档 ， 你 只 和 需 记 住 第 二 个 参数 一 定 是 个 项 式 列 表 就 可 以 了 。 一般 来 说 ， 列 表 中 的 元 
素 应 该 与 格式 字符 串 中 的 格式 指示 符 一 一 对 应 机 换行 符 的 ~n 除 外 )。 

这 几 个 果 数 的 容错 性 要 优 于 io : format ( 。 即便 格式 规范 有 误 ， 消 息 也 能 输出 ， 而 不 至 
于 引起 航 尘 。 例 如 ， 如 果 第 二 个 参数 中 的 元 素数 ws 你 将 得 到 以 下 报告 : 


4> error_ logger:info msg("This is an ~s message~n", ["info", 
this_ ls _ an unused atom]). 














=INFO REPORT==== 4-Apr-2009::;14;42;37 === 
ERROR: "This is an ~S message~n" - ["info", this is an unused atom: 
Ok 


如 此 一 来 即便 在 写 代码 时 不 小 心 搞 错 了 日 志清 恩 格 式 也 不 至 于 丢失 洪 在 的 关键 信息 。 这 个 特 
性 看 似 没什么 大 不 了 的 ,但 却 非常 重要 。 
让 我 们 来 考察 一 些 更 为 实用 的 日 志 消 息 吧 : 


5> error_ logger:info msg("Invalid reply ~p from ~s ~n", [<<"gquux">>, 
"stockholm"|]). 


=INFO REPORT==== 4-Apr-2009::;:14;53:;06 === 
Invalid reply <<"gquux">> from stockholm 
ok 


当然 ,实际 系统 中 的 数据 总 是 通过 变量 传人 的 , 不 会 像 这 样 便 编 码 在 代码 中 。 请 注意 ~p: 这 
个 格式 指示 从 特别 有 用 。 如 我 们 在 2.5.1 方 所 述 , 它 可 以 将 给 定 的 值 格 式 化 成 更 易于 人 类 阅读 的 格 
式 一 一 在 处 理 包 含 字符 数据 的 列表 或 二 进 制 串 时 尤为 有 用 。 

除了 info_msg, 请 再 分 别 答 试 一 下 erzor _msg 和 warning_msg， 并 注意 其 中 的 区 别 。 你 会 
a 息 实 际 上 是 一 样 的 ; 这 是 因为 ， 在 默认 情况 下 ，warning 被 百 接 映 射 至 
error。( 出 于 历史 原因 , 实际 上 只 存在 info 和 error 两 种 消息 。 在 启动 Erlang 时 给 sr1 加 上 +ww 参 数 可 
以 取消 warning 到 error 的 映射 。) 
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除 此 以 外 ， 还 有 一 组 更 为 复杂 的 新 式 API 函 数 ， 它 们 允许 你 以 更 灵活 的 方式 定制 报告 格式 ， 
并 允许 你 赋予 报告 一 个 类 型 。 在 7.2.3 市 中 我 们 将 用 这 些 也 数 来 产生 日 志 事 件 。 现 在 ， 请 参阅 
Erlang/OTP 文 档 来 了 解 它 们 的 详细 使 用 方法 : 





error logger:error report (RePpPort) -> ok. 
error_logger:error_ report (Type, Report) -> ok. 
error logger:warning report (Report} -> ok 
error_logger:warning_report (Type, Report}) -> ok. 
error_logger:info report (Report} -> ok. 

error logger:info report (Type, Report} -> ok. 


你 已 经 对 Erlang 日 志 系 统 中 最 基本 的 error_logger 功 能 有 所 了 解 了 ， 接 下 来 我 们 将 讨论 
SASL 应 用 ， 看 看 它 给 日 志 系 统 带 来 了 些 什么 。 





7.1.4 SASL 与 崩溃 报告 


为 了 让 后 续 的 学 习 更 为 具体 ， 我 们 先 来 创建 一 个 简短 的 gen_server， 如 代码 清单 7-1 所 示 ， 
它 启 动 后 唯一 的 任务 就 是 运行 一 段 时 间 然 后 自行 关闭 。 


代码 清单 7-1 错误 报告 示例 : die_please.erl 


-module (die please). 


-behaviour (gen_server). 





-export([start _ link/0]}. 


-export ([init/1, handle call/3, handle cast/2, handle info/2, 
terminate/2, code_change/31]1). 


-define (SERVER, ?MODULE}. 
-define (SLEEP TIME, (2*1000))., 





-record [lstate, {}). 


start link{} -> 
gen server:start link({local, ?SERVER}, ?MODULE, [], []). 


init({[]) -> 


下 0 


handle call{ Request, _From, State) 一 > 
Reply = OK， 
{reply, Reply, State}. 


handlje cast!{ Msg, State} 一 > 
{noreply, State}. 


handle _ info(timeout, State}) -> 9 引发 异常 
1 want to die = right now, 
{noreply, State}. 





terminate!{( _ Reason, _State) -> 
OK . 
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code change{ OldVvsn, State, _Extra}) 一 > 
{ok, State}. 


与 之 前 几 章 中 的 情形 类 似 ， 这 个 gen_servez 也 同样 徐 单 明了 。 此 处 再 次 用 到 了 服务 硕 的 超 
时 功能 人 @， 我 们 在 init/1 函 数 中 设置 了 一 个 以 毫秒 为 单位 的 超时 。 在 这 段 时 间 内 服务 器 如 果 没 
有 收 到 任何 请 求 ( 它 也 不 应 该 会 收 到 请 求 )，handqle_info/2 将 被 调用 ， 且 第 一 个 调用 参数 为 原 
Te ( 请 回想 一 下 ，handle 0 回调 函数 用 于 人 处理 种 外 消 奶 。) 但 该 吨 数 有 些 异 乎 

: 你 在 这 儿 写 下 了 一 些 明显 会 导致 异常 并 致使 进程 退出 的 代码 人 @ ( 这 两 个 原子 绝 不 可 能 
A 在 此 我 们 只 是 想 试 试 SASL 的 日 志 功 能 ， 别 担心 。 

1. 基本 错误 报告 

编 详 醒 块 时 ， 编 详 符 会 对 这 个 扎 眼 的 错误 发 出 警告 ， 无 视 它 就 好 。 随 后 ， 你 将 看 到 纺 详 结 
fok,，. . .}， 表 示人 代码 终究 还 是 通过 了 编译 : 

1 VS5 .7 (abort with ^G) 

1> c{"die please.erl"). 


./die please.erl:29: Warning: no clause will ever match 
{ok,die Pleasel 


( 请 在 这 个 示例 的 源码 所 在 的 日 录 下 重新 启动 一 个 Erlang shell。) 模块 编译 完毕 之 后 ， 用 
start_l1ink/0 困 数 启动 它 ， 如 下 : 


2> die please:start link!{(}). 
{ok,<0.40.0>} 
3> 
=ERROR REPORT==== 4-ApPr-2009:;:15:18:;25 === 
xx Qeneric server die please terminating 
** Last message in was timeout 
xx When Server state == {state} 
** Reason for termination == 
xx {{badmatch,right now}, 
[{die please,handle info,2}, 





























{gen server,handle msg,5}, 
‘(Broo TibinLt pb do apply;3711 
xx exception error: no match of right hand side value right now 
in function die please:handle info/2 
in call from gen server:handle msg/5 
in call from proc lib:init pp do apply/3 


服务 需 进 程 顺 利 启 动 , 2 秒 之 后 退出 , 在 退出 的 同时 还 输出 了 一 些 较 有 实用 价值 的 错误 信息 。 
接 下 来 ， 我 们 来 启动 SAASL， 看 看 事情 会 有 何 改 观 。 

2. 局 动 SASL 

手工 启动 SASL 应 用 ， 如 下 : 


4> application:start (sasl}. 
Ok 

















除了 此 处 列 出 的 ok 以 外 ， 屏 右 上 还 深 动 着 大 有 段 难 以 解读 的 文本 。 别 担心 ， 那些 只 是 SASL 输 出 的 
info 日 志 消 息 。SASL 应 用 提供 的 功能 可 不 仅 限 于 日 志 , 屏幕 上 一 扫 而 过 的 那些 全 都 是 各 种 服务 启 
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动 时 输出 的 info 消 息 。 每 个 进程 启动 时 ， 都 会 把 当前 状态 信息 打印 至 日 志 中 (此 处 的 日 志 就 是 终 
疝 )。 这 些 内 容 相当 琐碎 ， 限 于 篇 幅 我 们 在 这 个 例子 中 略 去 了 日 志 输 出 。 

标准 日 志 消 息 一 一 即使 用 7.1.3 市 中 列 出 的 各 基本 函数 输出 的 消息 一 一 在 任何 Erlang 系 统 中 都 
可 用 。 应 用 还 可 以 使 用 目 定 义 的 报告 类 型 ， 但 除非 为 之 添加 对 应 的 事件 处 理 带 ,否则 日 定义 报告 
类 型 会 被 系统 忽略 。SASL 中 就 有 这 样 一 个 处 理 融 ， 用 于 监听 由 标准 OTP 行 为 模式 发 送 的 报告 ， 
报告 发 送 的 时 机 很 多 ,包括 监督 者 局 动 时 、 监 督 者 重启 子 进程 时 、 子 进程 意外 退出 时 ， 以 及 
gen_server 等 行为 模式 进程 衣 演 时 。 在 启动 SAASL 时 ， 你 会 看 到 SASL 主 监督 者 还 启动 了 若干 工 
作 进 程 。 

让 我 们 来 看 看 启动 SAASL 之 后 上 一 个 示例 的 运行 状况 会 发 生 些 什么 变化 : 

5> die please:start link{). 

(ok,<0.53.0>] 

6> 


=ERROR REPORT==== 4-Apr-2009::15:21:3 === 
** Generic server die please terminating 

















** Last message in was timeout 

** When Server state == {state} 

** Reason for termination == 

xx {{jbadmatch,right_ now}., 
[{die please,handle info,2}, 
{gen_ server,handle msg,5}., 
{proc_lib,init p_ do apply,3}]} 














日 > 
=CRASH REPORT==== 4-APIr-2009::15:21:37 === 
crasher: 
initial call: die please:init/1 
pid: <0.53.0> 
registered name: die please 
exception exit: {{badmatch,right nowl}, 
[{die please,handle info,2}, 
{gen_server,handle msg,5}, 
{Proc lib,init p do apply,3}]} 
in function gen server:terminate/é6 














ancestors: [<0.42.0>] 
messages: [|] 

links: [<0.42.0>] 
dictionary: [|] 


trap_exit: false 

status: running 

heap size: 377 

stack size: 24 

reductions: 132 

neighbours: 

neighbour: [{pid,<0.42.0>}, 
{registered name,[]}, 
{initial_ call, {erlang,apply,2}}, 
{current_function,{shell,eval loop,3}}, 
{ancestors, []}, 
{messages,[]}, 
{links, [<0.27.0>,<0.53.0>]}, 
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{dictionary, []}, 
{trap_exit, false}, 
{status,walt1ing}, 
{heap_size,1]597}, 
{stack size,6}, 
{reductions,3347}] 
xx exception error: no match of right hang side value right now 
in function die please:handle info/2 
in call from gen server:handle msg/5 
in Call from Proc lib:init p do apply/3 


之 前 的 错误 报告 照常 发 出 ， 与 此 同时 你 还 得 到 了 一 份 来 日 SASL 的 朋 演 报告 ,其 中 包含 了 大 
量 有 关 故 障 进程 的 额外 信息 。 在 调试 实际 系统 中 的 有 表演 时 这 类 信息 的 价值 尤为 凸显 。 

3. SASL 不 过 用 时 怎么 办 

接 下 来 请 再 看 一 个 例子 。 我 们 来 创建 一 个 与 gen_servez 无 关 的 简单 模块 ， 看 看 会 发 生 些 什 
么 。 代 码 清 单 7-2 中 的 代码 的 行为 和 上 一 个 例子 基本 相同 ， 只 是 更 为 和 测 单 ， 且 没有 使 用 OTP。 


代码 清单 7-2” 非 OTP 进 程 朋 尝 示例: die_ please2.erl 


-modGdule (die please2). 














-export(t[go/0]1). 





-define {SLEEP TIME, 2000). 


加 = 
SS Just sleep for a while, then crash 
timer: sleep (?SLEEP TIME), 9 导致 进程 朋 溃 
i]_really want to die = right now. 


> Yh -HH 本 人 
编译 运行 这 个 模块 ， 将 会 看 到 : 
6> Clfdle please2.erl'"). 
./die please2.erl:10;:; Warning: no clause will ever match 





{ok,die please2} 

6> spawn{fun die_ please2:g90/0). 
<0.79.0> 

了 > 








进程 将 于 启动 后 2 秒 因 badmatch 错 误 合 而 退出 。 即 便 启 动 了 SASL， 错 误 信 息 (未 在 此 处 展 
示 ) 也 远 没 有 上 一 个 例子 中 那么 丰富。 个 中 原因 很 简单 : 要 启用 SASL， 还 需要 一 些 预备 工作 。 
当 你 以 gen_server 和 supervisor 等 行为 模式 为 基础 构建 应 用 时 ， 这 些 工 作 可 以 由 系统 自动 完 
成 。 你 上 自己 编写 的 进程 可 就 享受 不 到 这 个 竺 遇 了 一 一 要 想 不 盘 而 获 可 是 行 不 通 的 。 

稍微 做 一 些 变通 ， 你 可 以 部 分 达到 目的 。 让 我 们 再 试 一 次 ， 但 这 次 用 proc_1ipb:spawny/1 
代替 普通 的 spawn/1 来 启动 进程 . 

7> Proc lib:spawn(fun die please2:9g90/0}). 

<0.83.0> 

8> 

=CRASH REPORT==== 4-Apr-2009;:15:34:45 === 


crasher: 
initial call: die please2:g90/0 
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Dlg <0 .383.0 


registereqd name: [] 

exception error: no match of right hand side value right_ now 
In function die please2:g0/0 

ancestors: [<0.77.0>] 

messages: [| 

links: [| 

Qictionary: [【] 

trap_exit: false 

status;: running 

heap_size: 233 

stack size: 24 





reductions: 72 
neighbours: 


这 下 SASL 骨 尝 报 告 也 输出 了 。proc_lib 模 块 是 Erlang stdlib 应 用 的 一 部 分 ， 利 用 它 你 可 以 按 
OTP 的 方式 来 启动 进程 ， 它 会 按照 OTP 的 一 些 必要 规范 对 进程 进行 设置 。 虽然 ( 就 目前 而 言 ) 可 
能 性 不 大 ， 但 如 果 你 人 硬是 要 编写 脱离 现成 的 行为 模式 的 进程 ， 那 么 最 好 用 proc_lib 来 启动 进程 。 
从 长 期 来 看 这 样 做 会 更 有 利 。 

现在 你 已 经 掌握 了 Erlang/OTP 中 基本 日 志 功 能 的 使 用 方法 ， 配合 SASL 和 脱离 SASL 的 使 用 场 
景 我 们 也 分 别 做 了 考察 。 在 下 一 节 中 , 我 们 将 介绍 事件 处 理 系统 的 工作 原理 ， 同 时 还 会 介绍 如 何 
通过 挂 接 自 定义 事件 处 理 需 来 进一步 操控 日 志 。 


7.2 用 gen_event 编写 目 定 义 事件 处 理 


可 能 你 并 不 喜欢 错误 日 志 记录 器 的 默认 输出 格式 , 它 与 所 有 其 他 系统 所 使 用 的 格式 确实 有 较 
大 的 差异 。 你 所 在 的 企业 可 能 已 经 于 绕 自 己 的 日 志 格 式 开发 了 大 量 工 具 ， 这 些 工具 无 法 与 Erlang 
的 日 志 格 式 兼容 。 这 时 你 该 怎么 办 呢 ? 还 好 , 错误 日 志 记录 器 允许 你 在 日 志 系 统 中 穿插 自 定义 的 
逻辑 并 输出 自 定义 的 错误 信息 。 











2 





























7.2.1 gen event 行 为 模式 简介 


日 志 功 能 是 构筑 在 Erlang 的 事件 处 理 框架 之 上 的 ， 而 该 框架 又 以 gen_event 行 为 模式 为 基 
础 。 该 行为 模式 为 事件 处 理 硕 封 竣 了 人 徐 单 多 用 的 接口 。 要 想 进 一 步调 整 Erlang/OTP 的 日 志 框 淋 ， 
就 得 编写 新 的 gen_event 行 为 模式 的 实现 模块 ， 好 在 这 个 任务 并 不 难 。gen_event 行 为 模式 接 
器 与 gen_server 的 类 似 , 其 中 包含 你 所 熟悉 的 T1711 code_change 和 terminate 回 调 函数 
也 包含 handl e_calL1 和 handq1l e_ lmnfo 回调 。( 在 参数 和 返 回 值 方面 二 者 之 间 存 在 一 些 细 微 差 别 ， 
在 参阅 文档 之 前 请 不 要 擅 目 假设 。) 不 过 gen_event 接 口 用 handqle_event/2 取 代 了 
handle_cast/2， 你 大 概 猜 到 了 ， 这 儿 正 是 你 接收 错误 日 志 事 件 的 地 方 。 

gen_event 和 gen_server 之 间 的 一 个 重要 区 别 在 于 当 你 启动 新 的 gen_server 容 右 时 ， 你 
需要 告诉 它 应 该 使 用 哪个 回调 模块 (这样 也 就 可 以 了 ); 但 在 启动 gen_event 容 器 (有 时 也 被 称 
作 事 件 管理 器 ) 时 ,起 初 是 无 须 任 何 回调 模块 的 。 相 反 , 在 容 需 完成 初始 化 之 后 ,可 以 动态 添加 
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(或 删除 ) 一 个 或 多 个 处 理 锅 。 当 事件 被 投递 至 事件 管理 表 时 ， 事 件 管理 融会 调用 当前 已 注册 的 
所 有 处 理 需 模块 来 处 理事 件 。 二 者 之 间 的 区 别 如 图 7-1 所 示 。 


y 





gen_ Server 
JP DS 
合 雁 


行为 模式 实现 









gen_event a 
安 堆 个 或 多 个 行为 


模式 实现 


局 





图 7-1 gen_server 和 gen_event 回 调 模块 的 使 用 。 每 个 gen_servez 容 锅 仅 与 一 个 特定 
的 实现 (回调 ) 模块 绑 定 ， 而 每 个 gen_event 容 器 可 以 动态 增删 任意 多 个 回调 模块 


正 是 由 于 这 种 一 对 多 的 关系 ， 在 实现 了 gen_event 行 为 模式 的 回调 模块 中 一 般 是 找 不 到 
start_1Link 图 数 的 ; 即便 有 ， 该 也 数 一 般 也 都 会 先 检查 容 带 进程 是 否 已 经 启动 (当然 ， 仅 在 容 
器 进程 是 经 过 注册 的 单 例 进程 时 这 么 做 才 有 意义 )。 男 外 请 记 住 ， 事件 管理 大 要 调用 的 回调 模块 
可 不 止 这 一 个 , 因此 , 不 要 对 事件 管理 右 进 程 的 状态 做 出 什么 异乎 寻常 的 举动 , 至 于 其 他 处 理 需 ， 
只 能 禄 实 它 们 同样 守 规 矩 了 。 

和 gen_server 一 样 ， 为 了 便于 访问 ，gen_eventj 进 程 局 动 时 也 可 以 有 一 个 注册 名 《正如 第 3 草 中 
的 tr_server )。 接 下 来 ， 你 将 问 注 册 名 为 error_logger 的 标准 系统 进程 中 添加 一 个 处 理 带 ， 该 进 
程 在 所 有 Erlang/OTP 系 统 中 都 存在 。( 这 正 是 SASL 启 动 时 的 工作 。) 当 你 调用 error logger 模 块 中 的 
日 志 函 数 时 ， 所 有 日 志 事 件 都 会 被 发 送 给 这 个 进程 。error logger 模 块 中 还 有 一 个 专用 于 添加 报告 
处 理 器 的 API 函 数 ， 有 了 它 你 就 无 须 关 心事 件 处 理 器 进程 的 定位 问题 了 ; 该 函数 知道 应 该 把 处 理 
融 谎 加 至 哪个 进程 ， 并 会 连同 该 进程 的 注册 名 一 起 将 调用 委托 给 gen_event :aqdq_handler/3。 









































7.2.2 事件 处 理 器 示例 


你 即将 开发 的 简单 日 志 事 件 处 理 此 的 骨架 参见 代码 清单 73。 这 只 是 错误 日 志 记 录 奉 
gen_event 行 为 模式 的 一 个 最 简单 的 实现 。 接 收 事件 后 它 只 会 说 :“OK， 继 续 吧 。” 别 的 就 什么 
也 不 会 了 。 


代码 清单 7-3 ” 目 定 义 日 六 插件 模块 : custom error report.erl 


-module (custom error report). 








-behaviour (gen event). 


知客 API 
-export( [register _ with logger/0]). 





-export([init/l1, handle event/2, handle call/2, 
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handle_info/2, terminate/2, code_ change/3]). 
-record(lstate, {}). 


register with logger() -> 

error logger:add report handler (?MODULE). < 十 一 | 

将 该 模块 添 加 为 加 | 调 
init([]} -> 
{ok, #state{}}. 


handle event': Event, State) -> 
{ok, State}. 


handje call!{ Regquest, State) 一 > 
Reply = ok, 
{ok, Reply, State}. 





handle info{_ Info, State) -> 
{ok, State}. 


terminate{( Reason, _State) -> 


OK . 


code change OldVsn, State, 
{ok, State}. 


_ Fxtra}) -> 


永 不 停歇 

在 早先 的 gen_server 回调 函数 中 ， 通过 返回 stop， 函 数 可 以 令 服 务 器 进程 关闭 。 在 
gen_event 进程 中 却 不 可 以 这 么 做 〈 如 果 整 个 服务 部 被 干 控 ， 已 注册 的 其 他 处 理 器 可 就 无 所 适 
从 了 ),。 这 种 情况 下 ， 回 调 函 数 可 以 返回 remove_handler， 收 到 该 返回 值 之 后 gen event 进 
程 会 将 处 理 器 移 除 ， 并 在 最 后 时 刻苦 你 调用 回调 模块 中 的 terminate 函数 。 











现在 你 只 需 重 新 编译 模块 并 调用 模块 中 的 API 汕 数 custom error report:register_ 
) 将 它 挂 载 到 错误 日 志 记 录 表 的 事件 流 中 即 可 。 
7.2.3 ”处 理 错误 事件 


接收 到 事件 后 就 要 进行 处 理 。 在 当前 这 个 例子 中 , 我 们 仅 需要 将 它们 输出 到 屏幕 。 要 恰当 地 
展现 这 些 事 件 ， 就 必须 了 解 它 们 的 确切 含义 。error_ loggez 中 的 图 数 会 产生 一 组 特定 的 事件 。 
Erlang/OTP 文 档 对 此 作 了 总 结 ， 参 见 表 7-1。 


表 7-1 错误 日 志 记录 器 事件 














with logdge ( 








事件 元 组 来 源 
{error, Gleader, {Pid,Format,Data}} error_msg ( ) 
{error report, Gleader, {Pid,Type,Report})} error_ report() 
{warning_ msg, Gleader, {Pid,Format,Data}} warning_msg ( ) 
{warning_report, Gleader, {Pid,Type,Report})} warning_report() 
{info msg, Gleader, {Pid,Format,Data}} info_msg () 
{info_ report, Gleader, {Pid,Type,Report})} info_ report() 
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调用 汇报 水 数 时 ， 如 果 没 有 指定 类 型 ， 事件 将 被 赋 了 默认 的 报告 类 型 。 其 中 由 error_rep- 
Grt、 warning_report 和 ijnfo_report 标 记 的 事件 ， 默认 类 型 分 别 为 stqd_error、 std warn- 
ing 和 sta_info。 除 了 这 3 个 类 型 之 外 ， 任 意 类 型 标识 符 和 都 可 用 于 用 户 目 定义 的 报告 类 型 。 
Gleader (进程 组 主管 ) 字段 暂且 可 以 忽略 ， 该 字段 用 于 指定 标准 输出 的 目的 地 。 

代码 清单 7-4 中 的 例子 不 太 自 然 ， 请 别 在 意 ， 我 们 只 是 想 用 它 展示 一 下 应 该 如 何 利 用 上 述 内 
容 去 修订 代码 清单 7-3 中 的 handle_event/2 回 调 。 


代码 清单 7-4 ”处理 error_ logger 事 件 




















handlje event ({error, Gleader, {Pid,Format,Data}}, State) -> 
lo: fwrite("ERROR <~p> ~s", [Pid, io_lib:format (Format, Data)]), 
{ok, State}; 

handle event ({error report, _Gleader, {Pid, std error, Report}}, State} -> 
IOtwrlitel ERROR <~p> ~p'", [Pid, Report])}), 


{ok, State}:; 
handle event ({error report, Gleader, {Pid, Type, Report}}, State}) 一 > 


io:fwrite("ERROR <~p> ~p ~p", [Pid, Type, Report])}), 
{ok, State}:; 
handle event ({warning_ msg, _Gleader, {Pid, Format, Data}}, State) -> 
lo:fwrite ("WARNING <~p> ~s", [Pid, io lib:format {Format, Data)]), 
{ok, Statel}:; 
handle_ event ({warning_ report,_Gleader, {Pid,std warning,Report}}, State} -> 


lo:fwrite('"WARNING <~p> ~p", [Pid, Report]), 
{ok, State}:; 
handle event ({warning report, Gleader, {Pid, Type, Report}}, State) 一 > 


io:fwrite ("WARNING <~p> ~p ~p'", [Pid, Type, Report]), 
{ok, State}: 

handle_ event ({info msg, _Gleader, {Pid, Format, Data}}, State) -> 
lioO:fwrite("INFO <~p> ~s", [Pid, io_lib:format (Format, Data)])}), 


{ok, State}; 

handle event ({info report, Gleader, {Pid, std info, Report}}, State} 一 > 
jo:fwrite("INFO <~p> ~p", [Pid, Report]), 

{ok, State}.:; 

handle event ({info report, Gleader, {Pid, Type, Report}}, State) 一 > 
io:fwrite{('"INFO <~p> ~p ~p'", [Pid, Type, Report])}), 

{ok, State}; 





handle event!{ Event, State}) 一 > 
{ok, State}. 


这 段 代 人 码 的 作用 仪 仅 是 将 数据 以 略为 不 同 的 格式 下 接 打 纯 至 标准 输出 ,但 通过 它 你 应 该 能 明 
日 该 如 何 编写 自 定 义 插 件 。 请 注意 ， 有 时 你 会 收 到 一 些 无 法 与 上 述 格 式 列表 相 匹 配 的 事件 ,它们 
一 般 都 是 些 可 以 忽略 的 系统 消息 , 但 你 仍然 需要 在 最 后 加 上 一 个 通 配 子 句 来 处 理 这 些 事 件 , 说 上 
一 名 “OK” 就 够 了 。 

建议 你 编译 代码 清单 7-4 中 的 代码 ， 将 它 挂 载 到 系统 中 ， 并 按照 7.1.3 节 中 的 日 志 示 例 发 起 几 
次 调用 ， 看 看 有 什么 动静 。 你 也 可 以 尝试 一 下 error_logger 模 块 中 的 自 定 义 汇报 函数 ， 如 
info report (Type,Report) ( 详情 请 参见 Erlang/OTP 文 档 )。 

至 此 ， 我 们 已 经 完成 了 对 Erlang 日 志 基 础 功能 中 最 重要 的 内 容 的 介绍 。 通 过 这 些 内 容 ， 你 应 
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该 已 经 对 下 列 内 容 的 工作 原理 有 了 民 好 的 认识 : 

UD error_loggerAP!l; 

口 SASL 进 程 报 告 和 骨 演 报告 ; 

口 gen_event 行 为 模式 ; 

口 通过 日 行 实现 gen_event 行 为 模式 来 目 定 义 错误 日 志 记 录 希 。 

现在 ， 你 可 以 把 这 些 技术 应 用 到 上 一 章 的 Simple Cache 应 用 中 了 。 这 正 是 下 一 节 的 内 容 ， 你 
将 学 会 创建 自 定 义 的 应 用 级 事件 流 的 方法 。 


7.3 为 Simple Cache 添加 自 定义 事件 流 


如 本 章 开 头 处 所 述 ， 在 Simple Cache 系 统 上 我 们 还 有 很 多 工作 可 做 。 在 上 一 节 中 ， 我 们 介绍 
了 如 何在 代码 中 添加 标准 错误 日 志 消 息 ， 以 及 如 何 利 用 SASL 应 用 去 更 好 地 了 解 OTP 服 务 需 以 及 
监督 者 的 行为 。 我 们 还 介绍 了 事件 处 理 系统 的 工作 原理 以 及 编写 目 定 义 事 件 处 理 天 的 方法 。 然 而 ， 
抛 开 错 误 日 志 记 录 需 ， 要 想 在 上 自己 的 应 用 中 创建 应 用 相关 的 事件 流 又 该 怎么 做 呢 ? 

对 于 这 套 绥 存 系统 来 说 , 你 可 以 对 外 发 布 一 系列 的 事件 , 用 于 癌 外 界 通 告 系统 中 发 生 的 各 种 
操作 ， 如 插入 、 删 除 、 淘 汰 时 间 过 期 以 及 查询 等 。 有 了 目 己 的 事件 流 ， 你 的 用 户 便 可 以 轻而易举 
地 将 事件 处 理 需 挂 载 进 你 的 系统 。 而 借助 这 些 事 件 处 理 需 ,回答 “在 上 一 小 时 中 缓存 被 查询 了 多 
少 次 ? ”“， 还 有 “缓存 条 目 由 于 在 淘汰 时 间 内 未 被 访问 而 被 清理 掉 的 频率 有 多 高 ? ”等 问题 也 就 
轻而易举 了 。 

在 这 一 节 中 ， 我 们 将 用 gen_event 行 为 模式 创建 一 个 日 定义 事件 流 。 接 着 还 要 把 它 集 成 至 
Simple Cache 应 用 中 , 为 此 我 们 需要 将 它 挂 人 监督 结构 , 并 在 各 关键 点 处 插入 用 于 投递 事件 的 代码 。 
最 后 ， 我 们 还 要 编写 一 个 事件 处 理 需 来 截获 这 些 事件 。 但 首先 ， 我 们 得 先 设 计 一 下 事件 流 的 API。 




































































7.3.1 事件 流 API 

应 用 级 事件 系统 的 API 由 sc event 模 块 实现 。 和 以 往 一 样 , 你 应 该 将 实现 细节 尽 可 能 地 封装 起 
来 , 仅 留 出 一 组 易于 使 用 的 本 数 ， 供 所 有 和 希望 订阅 该 事件 流 的 用 户 使 用 。 这 个 模块 很 简单 ， 参 见 
代码 清单 7-5。 
代码 清单 7-5 ”Simple Cache 事 件 流 API: src/sc event.erl 


-module{sc event). 





-export ([start link/o0, 
add handler/?2, 
delete handler/2, 
lookup/1, 
create/2, 
replace/2, 
delete/1])}). 


-define (SERVER, ?MODULE). 
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start link() -> 2 隐藏 gen_event 启 动 函 数 
gen event:start jink{{local, ?SERVER})., 
add_ handler (Handler, Args) -> 
gen event:adgd handler (?SERVER, Handler, Args). 隐藏 gen_event 人 处理 器 注 
有 册 逻 辑 


delete_handler (Handler, Args) -> 
gen_event:delete handler(?SERVER, Handler, Args). 


lookup (Key) 一 > 
den event:notify{?SERVER, {lookup, Key}}). 


Create(Key, Value) -> 
gen event:notify{?SERVER, {create, {Key, Value}}). API 函 数 
replace (Key, Value) -> 


gen event:notify!{?SERVER, {replace, {Key, Value}}). 





deletel(Key) -> 
gen event:notify(?SERVER, {delete, Key}}. 


可 以 看 到 ， 这 个 API 模 块 并 未 实现 任何 OTP 行 为 模式 。 但 它 却 提 供 了 一 个 你 所 熟知 的 
start_link() 图 数 。 在 这 个 例子 中 , 它 的 作用 在 于 隐藏 对 gen_event : start_link/1 函 数 的 
调用 @@， 该 调用 将 启动 一 个 新 的 gen_event 容 器 进程 并 以 该 模块 的 名 字 在 本 地 注册 。 

如 我 们 在 7.2.1 闻 所 说 ，gen_event 行 为 模式 的 实现 模块 大 都 没有 start_1inkAPI 图 数 。 一 
般 情 况 下 ， 下 接 由 监督 者 启动 的 都 是 gen_event 容 角 〈 也 叫 事 件 管理 顶 ) 而 非 gen_event 实 现 模 
块 ， 参 见 下 列子 进程 规范 示例 : 


{my logger, 
{gen event, start_link, [{local, my_logger}]}, 
bermanent, 1000, worker, [gen event]} 


(请 拿 代 码 清单 4-3 中 init7/1 函 数 中 的 子 进程 规范 与 上 述 示例 作 一 个 比较 。) 启动 之 后 ， 你 便 
可 以 以 my_logger 为 名 来 引用 该 容 右 进程 并 癌 其 中 添加 处 理 右 。 

然而 这 些 实现 细 方 不 应 该 骏 露 给 其 他 代码 ,我们 希望 用 户 无 须知 晓 管理 帮 进 程 的 进程 名 也 可 
以 添加 事件 处 理 磊 。 为 了 达到 这 个 目的 ， 你 不 仅 要 提供 start_1ink 图 数 ， 还 要 为 gen_event 的 标 
准 注册 也 数 add_handler/3 及 delete_handler/3 提 供 一 对 包装 也 数 @, 这 与 你 在 代码 清单 7-3 
中 为 error_logger 的 注册 了 数 adqd_report_handler/1 编 写 的 包装 卫 数 类 似 。 这 样 一 来 用 户 
接口 层 就 与 进程 注册 名 完全 无 关 了 。 

紧 随 其 后 的 4 个 函数 才 是 真正 的 事件 人 处理 API。gen_event 模 块 的 notify/2 函 数 可 用 于 投递 
异步 事件 ， 类 似 于 gen_server 中 的 cast/2。API 函 数 伟 对 协议 进行 了 封装 ， 与 第 3 章 (代码 清 
单 3-2 ) 中 tr_servezr 封 痛 服 务 责 与 客户 端 之 间 的 协议 的 方法 类 似 。 但 对 于 事件 处 理 带 而 言 ， 这 
层 封 疾 不 如 tr_server 的 封装 来 得 彻底 : 你 所 添加 的 每 个 回调 模块 都 必须 能 够 解读 API 模 块 中 定 
义 的 协议 ， 因 此 你 应 该 在 文档 中 将 协议 写 清楚 (可 能 只 是 内 部 文档 ,， 视 该 事件 系统 的 使 用 范围 而 
定 )。 然 而 无 论 是 哪 一 方 ， 都 不 应 该 将 协 以 中 使 用 的 项 式 和 又 露 给 其 他 部 分 的 代码 。 表 7-2 总 绪 了 上 月 
定义 事件 流 中 的 协议 。 
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表 7-2 ”Simple Cache 中 的 应 用 层 事件 


事件 元 组 投 网 方 
{1ookup ，Key} sc_event:1lookup/l1 
{create, {Key, Value}} sc_event:create/2 
{replace, {Key, Value}} sc_event:replace/2 
{delete, Key} sc_ event:delete/1 














有 了 这 三 API, 要 想 执行 投递 查询 事件 之 类 的 事情 ， 只 需 调用 sc_event :1lookup (Key) 就 可 
以 了 。 修改 事件 协议 或 其 他 实现 细节 时 , 你 也 不 必 逐 行 般 历 整 个 代码 库 去 修改 所 有 投递 了 该 事件 
的 代码 了 。 

接 下 来 , 我 们 将 把 该 模块 挂 接 进 系统 , 将 事件 系统 与 Simple Cache 应 用 整合 为 同时 启 停 的 整体 。 





7.3.2 ”将 处 理 器 整合 进 Simple Cache 


首先 你 应 该 明日 ， 作 为 一 个 服务 ，sc_event 模 块 局 动 的 gen_event 容 需 进 程 应 该 由 监督 者 来 管 
理 。 此 外 ， 每 个 OTP 应 用 仅 有 一 个 根 监督 者 ， 其 他 所 有 进程 都 由 该 监督 者 负责 启动。 现在 的 问题 
在 于 第 6 章 中 创建 的 根 监 督 者 采用 的 是 simple_one_for_one 型 重启 策略 (参见 6.3.4 节 )。 这 个 
重 局 策略 可 以 很 好 地 应 对 我 们 之 前 面临 的 问题 , 但 这 种 监督 者 只 能 文 持 一 种 子 进程 类 型 ; 因此 当 
前 的 gen_event 进 程 无 法 直接 挂 到 该 监督 者 之 下 。 




















监督 者 的 命名 
在 <mod> 模 块 中 实现 的 服务 ,其 监督 者 的 实现 模块 用 <mod> Sup 命名 再 正常 不 过 了 。 例 如 ， 


SC element Sup。 


好 在 现 有 的 监督 者 模块 并 不 需要 重 写 。( 整个 缓存 服务 的 架构 高 度 依赖 于 该 模块 。) 不 过 你 得 
重新 给 它 起 个 名 字 : 根 监督 者 的 角色 不 能 再 由 它 来 承担 了 ， 你 需要 创建 一 个 新 的 sc_sup 模 块 来 承 
担 这 个 任务 。 首 先 ， 请 将 文件 src/sc_sup.erl 重 命名 为 src/sc_element sup.erl 并 修改 文件 中 的 模块 声 
明 ， 使 之 与 新 文件 名 相 匹 配 。 同 时 ， 记 得 更 新 sc element.erl, 将 create(Value, LeaseTime) 
了 浮 数 中 调用 的 sc_sup:start_child( oe ) 蔡 换 成 sgc_element_sup :eStart childt(,,»)s 

更 名 为 sc_element_sup 的 原 监督 者 进程 将 和 gen_event 进 程 一 起 , 变 成 新 的 项 层 监督 者 的 子 
进程 。 这 个 改动 不 难 ， 只 和 需 写 一 个 最 基本 的 监督 者 模块 ， 再 添加 两 个 子 进 程 规 范 就 行 了 。 新 的 监 
督 者 模块 如 代码 清单 7-6 所 示 。 


代码 清单 7-6 ”新 的 根 监督 者 : src/sc_sup.erl 


-modulel(sc sup). 





-behaviour (supervisor). 


告 千 有 PT 
-export([start link/0]). 


SS Supervisor callbacks 
-export([init/1])}). 
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-define (SERVER, ?MODULE). 


start _ link() 一 > 
supervisor:start link{({{local, ?SERVER}, ?MODULE, [|]). 


init{([]) -> 
ElementSup = {sc element sup, {sc element sup, start link, []}., 
permanent, 2000, supervisor, [sc element ] } ， 

EventManager = {sc_ event, {sc _ event, start_ link, []}, 

Pernenmnent, 2000, Workery [sc Event] 8 新 的 Sc event 进 程 
Children = [ElementSup, EventManager], 

lI 大 本 又 
RestartStrategy = {one_ for one, 4, 3600}, -© one for _ one 于 和 首 


{ok, {Restartstrategy, Children}}. 


可 以 看 出 ， 这 个 模块 跟 你 在 第 4 曹 中 编写 的 tr_sup【( 代码 清单 4-3 ) 很 像 。 二 者 同 为 相对 简单 
的 one_for_one 型 监督 者 人 @， 都 把 自己 的 子 进 程 视 作 相互 隔离 的 不 同类 型 的 个 体 ， 在 有 必要 重 
启 子 进程 时 , 重启 操作 也 是 以 单个 子 进程 为 单位 独立 进行 的 。 这 个 新 的 监督 者 静态 配备 了 两 个 子 
进程 (各 有 各 的 子 进程 规范 ): sc_element 原 有 的 监督 者 进程 和 新 的 sc_event 进 程 @，。 子 进程 本 身 
是 不 是 监督 者 ， 根 监督 者 并 不 关心 ， 但 我 们 仍然 把 sc_element sup 和 sc _event 子 进程 分 别 标记 为 
supervisor 型 和 worker 型 ， 这 样 做 可 以 辅助 系统 在 某 些 特定 情况 下 做 出 更 准确 地 判断 。( 子 进 
程 规范 中 各 字段 的 含义 参见 4.2.3 市 。) 还 循 这 个 模式 ， 你 可 以 在 应 用 中 以 任意 座 度 般 和 套 监 督 者 ， 
逐步 谋求 最 佳 粒度 的 监督 结构 。 

现在 , 事件 服务 已 经 和 应 用 融 为 一 体 , 剩 下 的 工作 就 是 调整 代码 进而 把 事件 抛 出 。 也 就 是 说 ， 
我 们 得 回 过 头 来 从 源码 中 找 出 合适 的 位 置 并 加 以 修改 ， 以 便 在 恰当 的 时 机 将 事件 投递 出 来 。 

在 这 儿 就 不 重复 列 出 所 有 代码 了， 我 们 仪 考察 一 个 函数 的 改造 过 程 。 痛 先 回顾 代码 清单 6-7 
中 的 simple_cache:insert/1L 困 数 : 















































insert (Key, Value) -> 
CasSe Sc_ Store:lookup(Key) of 
{ok, Pid} -> 
sc element:replace{Pid, Value): 





{error, _} -> 
{ok, Pid} = gc element:create {Value), 
sc store:insert (Key, Pid) 
End. 
新 建 存储 进程 时 应 该 投递 一 个 create 事 件 。 为 此 ， 将 代码 修改 如 下 : 
insert (Key, Value) -> 


CasSe SC_ Store:lookup(Key) of 
{Ok, Pid} -> 
sc element:replace{Pid, Value): 


{error, _} -> 

{ok, Pid} = sc element:create (Value), 

sc store:insert {Key, Pid), | 

Sc event:create(Key, Value,) < 十 一 投递 进程 创建 事件 
end 


只 和 需 在 恰当 的 位 置 插入 一 名 sc_event:create() 即 可 。 一 般 来 说 ， 同一 事件 的 投递 点 可 以 
有 多 个 选择 , 例如， 在 上 个 例 中 ,你 也 可 以 从 sc_element : create/1L 中 进行 投递 。 在 此 我 们 将 
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投递 点 选 在 了 进程 创建 操作 完成 后 的 某 处 。 表 7-2 中 其 余 3 个 事件 通知 的 添加 方法 与 此 类 似 , 我 们 
将 之 留 作 练 习 。 请 注意 ， 调 整 1ookupy/1 等 函数 时 返回 值 也 需要 一 并 修改 。 

现在 ,应 用 已 经 改造 完毕 ， 它 会 不 断 地 将 自己 的 行为 广播 给 所 有 的 事件 监听 者 。 为 了 监听 事 
件 ， 监 听 者 需要 将 相应 的 事件 处 理 喜 插 和 人 你 的 事件 流 ， 与 你 在 7.2 节 中 订阅 错误 日 志 记 录 需 时 的 
操作 类 似 。 下 一 小 节 将 展示 如 何 处 理 这 类 自 定义 事件 。 

















7.3.3 ”订阅 目 定 义 事件 流 

为 了 说 明 如 何 使 用 应 用 自 定 义 的 事件 流 ( 比如 你 刚 实现 的 那个 )， 我 们 将 创建 一 个 事件 处 理 
伪 并 让 它 与 Simple Cache 的 事件 流 对 接 。 这 与 7.2.2 市 中 错误 日 志 记 录 侣 的 事件 处 理 硬 示例 类 似 : 
二 者 都 是 gen_event 行 为 模式 的 实现 ,它们 之 间 的 区 别 仅 在 于 所 处 理事 件 的 集合 以 及 对 具体 事件 
的 处 理 方 法 。 

为 了 让 这 个 示例 有 一 些 实际 效果 ， 我 们 下 接 将 事件 透 传 至 错误 日 志 中 ， 这 样 也 便于 你 观察 。 
在 实际 应 用 场景 中 ， 你 可 以 将 这 些 事 件 转 发 至 某 个 统计 系统 或 远程 监控 系统 。 

代码 清单 7-7 便 是 日 定义 绥 存 事件 的 日 志 人 处 理 侣 。 该 模块 与 代码 清单 7-3 类 似 ; 人 简洁 起 见 ， 我 
们 省 略 了 除 handle_event/2 以 外 的 其 他 回调 函数 。 


























代码 清单 7-7 目 定 义 事 件 处 理 需 示例 : src/sc_event logger.erl 
-modulel(sc event logger). 
-behaviour (gen event})., 
-export([add handler/0, delete handler/0]). 


-export{([init/l1, handle event/2, handle_ call/2, 
handle_info/2, code_ change/3, terminate/2]). 


dd handl = 
add Dandlerty =% adqd handler/0 和 
sc event:add handler (?MODULE, [|]). delete handler/0 


wz 类 
delete handlerl}) = 函数 


sc_event:delete handler (?MODULE, [|])}). 


handle event({create, {Key, Value}}, State) -> 
error_ logger:info msg("create(~w, ~w}~n", [Key, Valuel]}, 
{ok, State}; 6 error logger 消 息 
handle_ event{{lookup, Key}, State) -> 
error_logger:info msg("lookup(~w})~n", [Key])}, 
{ok, State}.; 
handle event'i{delete, Key}, State) -> 
error_logger:info msg("'delete(~w}~n'", [Key]) ， 
{ok, State}: 
handle event({replace, {Key, Value}}, State) -> 
error_logger:info msg("replace (~w, ~w}j~n'", [Key, Valuel])}, 
{ok, State}. 


adqd_handler/0 和 delete_handler/0 人 @ 用 于 简化 日 志 功 能 的 开启 和 关闭 。 处 理 器 添加 完 
毕 后 ， 经 由 sc_event 投 递 过 来 的 每 条 日 志 都 会 转换 成 相应 的 handle_event/2 调 用 ， 直 至 你 将 
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该 处 理 送 移 除 。 

需要 处 理 的 事件 的 格式 参见 表 7-2。 你 所 需要 做 的 就 是 按 民 好 的 格式 把 发 生 的 事件 以 标准 
error_logger 消 息 @ 的 形式 打印 出 来 。 

我 们 建议 你 通过 实验 来 验证 上 述 的 工作 ， 步 又 如 下 : 改造 Simple Cache 应 用 、 编 写 事件 处 理 
髓 、' 编 译 改造 后 的 新 模块 ， 并 按 以 前 介绍 的 方法 启动 模块 "。 向 缓存 中 存 人 一 些 数据 并 执行 一 些 
查询 操作 ， 随 后 ， 调 用 sc_event_logger:add _handler () 添 加 日 志 处 理 名 ， 再 执行 一 些 缓存 
操作 , 同时 观察 日 志 消 息 中 是 否 出 现 了 我 们 预料 中 的 事件 。 移 除 处 理 硕 之 后 也 再 检查 一 下 相应 的 
日 志 是 否 会 如 期 消失 。 男 外 再 加 一 道 附加 题 ; 请 在 绥 存 中 添加 一 个 于 淘汰 时 间 过 期 时 投递 的 新 事 
件 ， 进行 相应 的 修改 并 观察 其 工作 情况 。 最 后 ， 记得 让 sc_app : start/2 在 sc_sup 启 动 成 功 之 
后 目 动 加 上 该 事件 日 志 处 理 硕 。 

















7.4 小结 


对 Erlang/OTP 事 件 处 理 的 学 习 就 告 一 段落 了， 内 容 可 丰 不 少 。 一 路 学 到 这 儿 ， 你 可 能 已 经 比 
很 多 在 Erlang 编 程 领域 措 候 深 打 了 多 年 的 人 还 要 博学 了 1 你 学 会 了 Erlang/OTP 标 准 日 志 系 统 的 使 
用 方法 ， 见 识 了 怎样 用 gen_event 行 为 模式 来 搭建 日 志 系 统 ( 同时 也 学 习 了 gen_event 的 工作 
原理 )， 还 学 会 了 应 该 如 何 通过 编写 事件 处 理 硕 来 与 日 志 流 对 接 ,， 进而 日 行 调整 日 志 输 出。 最 终 ， 
你 掌握 了 所 有 知识 ,借助 这 些 知识 , 可 以 创建 自己 的 应 用 级 事件 流 , 并 使 用 自 定 义 事件 处 理 需 将 
事件 传递 给 错误 日 志 记 录 人 条 。 

也 许 你 和 我 们 一 样 ， 对 这 一 音 的 内 容 感到 兴 香 不 已 ， 甚 至 党 得 有 点 儿 喘 不 过 气 来 。 好 好 喘 口 
气 ， 和 舒缓 一 下 情绪 。 下 一 曹 的 内 容 可 就 更 劲 烛 了 (至少 我 们 是 这 么 认为 的 )。 接 下 来 我 们 将 为 你 
介绍 Erlang 的 分 布 式 机 制 及 其 运用 方法 。 这 是 Erlang/OTP 最 为 强大 的 能 力 之 一 ， 想 必 你 已 经 迫 不 
及 待 了 吧 。 









































J 启动 模块 的 同时 别 忘 了 启动 SAASL。 方 法 之 一 就 是 在 用 命令 行 启动 erl 时 加 上 -boot start_sasl 参 数 。( 有 关 
-boot 参 数 的 详情 参见 第 10 章 )。 一 一 详 者 注 
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分 布 式 Erlang/OTP 简 介 


本 章 概要 

口 分 布 式 Erlang 概 要 

口 运用 Erlang 节 点 和 集群 

口 实现 一 套 人 简易 的 资源 探测 系统 





在 这 一 半 里 , 我 们 不 再 给 绥 存 应 用 添加 任何 新 的 功能 了 。 为 了 给 下 一 章 的 内 容 做 准备 ,我 们 
要 先 将 目光 转 癌 Erlang 的 分 布 式 编 程 能 力 。 尺 管 与 大 多 数 其 他 语言 相 比 ，Erlang/OTP 已 经 极 大 地 
简化 了 分 布 式 编程 ， 但 分 布 式 仍然 是 一 个 复杂 的 领域 。 你 将 在 本 章 中 学 会 运用 分 布 式 Erlang 的 基 
本 技能 , 但 要 真正 地 和 营 握 它 则 必须 勒 加 练习 。 随 痢 经 验 的 积累 ， 你 会 发 现 目 己 从 传统 串 行 编程 中 
积 标 的 经 验 在 分 布 式 场景 下 大 都 丧失 了 用 武之 地 。 不 过 别 担心 一 一 不 管 怎 样 ， 这 个 过 程 都 会 充满 
乐趣 ! 


8.1 Erlang 分 布 式 基础 


假设 你 在 机 器 A 和 机 器 B 上 各 跑 着 一 个 Simple Cache 应 用 的 实例 。 要 是 在 机 器 A 的 缓存 上 插入 
一 个 键 / 值 对 之 后 ， 从 机 器 B 上 也 可 以 访问 ， 那 可 就 好 了 了。 显然 ， 要 达到 这 个 目的 ， 机 器 A 必 须 以 
革 种 方式 将 相关 信息 告知 给 机 需 B。 传 递 该 信息 的 方式 有 很 多 ， 有 些 方式 简单 ， 有 些 方式 复杂 。 
但 无 论 采 用 哪 种 方式 ， 都 涉及 分 布 式 ， 因 为 你 需要 进行 路 机 融通 信 。 

Erlang 极 大 地 简化 了 某 些 类 型 的 分 布 式 编程 ， 用 不 了 几 行 代码 ， 你 瞬间 就 可 以 建立 多 人 台 机 融 
间 的 网 络 通 信 。 这 一 切 都 以 Erlang 的 两 个 基本 特性 为 基础 : 

口 复制 式 进程 通信 ; 

口 位 置 透明 性 。 

我 们 曾 在 第 1 章 中 对 此 做 过 简要 介绍 。 下 面 我 们 将 深入 探讨 一 下 这 两 个 属性 ， 看 看 它们 是 如 
何 使 分 布 式 成 为 可 能 的 。 我 们 还 会 解释 什么 是 Erlang 节 点 ， 它 们 之 间 又 是 如 何 相互 连接 进而 形成 
集群 的 ,此 外 ,我 们 还 会 向 你 介绍 基本 的 安全 模型 市 点 之 间 的 通信 方式 ,以 及 如 何 使 用 远程 shell。 
最 后 , 你 将 综合 运用 这 些 知 识 , 实现 一 父 复 杂 的 分 布 式 应 用 , 该 应 用 在 后 续 草 市 中 还 会 发 挥 作用 。 
但 是 ， 首 先 ， 让 我 们 来 看 一 下 为 何 Erlang 的 通信 模型 能 够 与 分 布 式 编程 配合 得 天 衣 无 终 。 
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8.1.1 复制 式 进 程 间 通信 


概括 一 下 我 们 在 第 1 章 中 的 观点 ， 在 解决 两 段 并 发 执行 的 代码 段 之 间 的 通信 问题 时 ， 最 笛 用 
的 模式 就 是 让 这 两 段 代码 共 圣 菏 块 内 存 , 前 提 是 它们 部 在 同一 台 机 各 上 运行 。 该 通信 模型 如 图 8-1 
所 示 。 然而 它 有 很 多 问题 ,其 中 之 一 是 当 你 希望 每 段 代码 部 运行 在 独立 的 机 具 上 时 ， 束 必须 换 用 
一 种 完全 不 同 的 通信 和 方式。 代码 中 的 很 大 一 部 分 将 被 迫 重 写 。 
斩 台 计算 机 
执行 代码 1 执行 代码 2 
































二 一 eo— 











图 8-1 ”传统 的 共享 内 存 式 进 程 间 通信 。 这 种 方式 要 求 通信 进程 双方 都 运行 在 同一 人 台 机 
船上 ， 和 否则 就 不 得 不 借助 菜 种 形式 的 分 布 式 共享 内 存 


这 类 问题 正 是 Elang 的 缔造 者 们 从 一 开始 就 要 解决 的 问题 。 要 想 在 通信 透明 化 的 同时 构建 出 容错 
的 系统 ， 要 想 让 一 台 机 融 不 至 于 因为 相 邻 机 融 的 朋 涡 或 机 带 间 的 网 络 故障 而 知 机 ， 就 必须 抛 痉 共享。 

相反 ，Erlang 的 进程 间 通 信 采 用 的 是 严格 的 和 异步 消息 传递 〈 发 送 消息 后 无 须 等 待 网 络 上 的 确 
认 )， 接 收 方 收 到 数据 时 实际 上 获取 了 数据 的 一 份 独立 的 副本 ; 此 后 接收 方 将 无 法 感知 发 送 方 对 
数据 所 做 的 任何 操作 ,反之 亦 然 。 后续 的 任何 通信 都 必须 借助 额外 的 消息 才能 进行 。 无 论 是 运行 
在 同一 台 机 各 上 的 进程 ( 参见 图 8-2 ) 还 是 运行 在 不 同 机 融 上 并 通过 网 络 互联 的 进程 (参见 图 8-3 )， 
这 种 模型 午 非 常 凑 效 。 


























单 台 计算 机 


消息 
> 


图 8-2 ”单机 上 的 Erlang 进 程 通过 消息 传递 进行 通信 。 就 效 末 而 言 接收 方 收 到 的 总 是 数 
据 的 一 份 私 有 副本 。 在 实际 应 用 中 ， 出 于 效率 因素 也 可 以 基于 只 读 共有 至 内 存 来 
实现 ， 但 从 进程 的 角度 来 看 其 实 是 一 样 的 


计算 机 A 计算 机 B 


(em) 消息 
Pa 


图 8-3 不同 机 器 上 的 进程 通过 消息 传递 进行 通信 。 这 种 情况 下 显然 需要 将 数据 从 一 台 
机 禹 复制 到 男 一 台 上 。 除 了 由 网 络 层 引入 的 传输 时 延 以 外 ， 和 图 8-2 一 般 无 二 
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可 以 看 出 ， 图 8-2 和 图 8-3 之 间 的 区 别 不 大 。 程 序 在 这 两 种 模型 中 切换 时 ， 无 须 修改 进程 通信 
模式 。 

在 Erlang 中 没有 共 草 ， 只 有 消息 传递 ， 因 此 分 布 式 还 是 单机 本 质 上 没有 什么 区 别 。 大 部 分 代 
码 完 全 不 用 关心 进程 最 终 在 何 处 运行 。 

然而 在 进行 网 络 通信 时 仍然 有 很 多 需要 注意 的 问题 。 在 使 用 本 地 通信 时 ， 只 要 接收 方 进程 还 
活 看 ”消息 就 一 定 能 送 达 ， 而 且 几 乎 没有 传输 延 退 。 然 而 一 旦 涉足 网 络 ， 就 不 得 不 考虑 路 由 过 
程 中 的 消息 延迟 以 及 网 络 本 里 的 故障 了 。 发 送 方 通常 无 法 辨别 接收 方 到 底 是 崩 演 了 还 是 因 目 映 的 
bug 而 未 能 给 出 应 答 。 出 于 健壮 性 考虑 ， 即 便 是 采用 本 地 通信 ， 发 送 方 也 应 该 对 这 些 故 障 有 所 准 
备 。 但 在 分 布 式 系 统 中 总 会 存在 多 种 导致 不 确定 性 行为 的 因素 。 

然而 统一 了 网 络 和 单机 通信 方式 也 不 意味 春 你 就 可 以 在 机 融 间 随意 迁移 代码 了 。 你 好 歹 还 得 
指定 消息 的 目的 地 ， 尤 其 是 要 把 消息 发 往 哪 台 机 带 ， 对 吧 ? 























8.1.2 位置 透明 性 

我 们 已 经 讲 过 , 进程 间 的 通信 方式 与 接收 方 在 本 地 机 天 上 还 是 在 远程 机 天 上 无 关 。 这 点 在 请 
法 层面 上 仍然 成 立 。 以 下 是 发 送 方 同位 于 同一 台 机 各 上 的 接收 方 发 送 消息 ( 本 例 中 是 个 字符 串 ) 
的 语法 : 


























Pid 1 "my message" 
然后 再 来 看 看 怎么 将 同一 条 消 奶 发 辣 男 一 台 机 和 玫 : 
Pid 1 "my message" 


抱歉 抱歉 ， 儿 不 住 皖 了 你 一 道 。 没 错 ， 二 者 一 模 一 样 :! (发 送 ) 运算 符 具 有 位 置 透明 的 局 
性 一 一 接收 方 在 哪 合 机 内 上 并 不 重要 ， 指 引 消 息 走 回 的 信息 统统 都 隐 仿 在 进程 标识 符 之 中 了 。 
Erlang 会 确保 进程 标识 符 在 多 机 网 络 上 的 惟一 性 。 这 个 属性 使 你 可 以 无 障碍 地 将 程序 的 部 署 规 模 
从 一 从 机 带 扩 展 到 数 十 人 台 机 带 ; 你 也 可 以 反 其 道 而 行 之 , 将 那些 原本 部 署 在 数 十 人 台 机 带 上 的 程序 
集成 到 你 的 笔记 本 电脑 上 进行 测试 。 

初 看 起 来 位 置 透 明 性 好 像 没 什么 大 不 了 的 , 然而 你 应 该 认识 到 , 正 是 它 大 大 释放 了 我 们 编程 
风格 的 目 由 度 。 当 路 计 算 机 通信 的 门槛 不 再 那么 陡 晴 ,你 终 将 获得 翻越 它 的 力量 ， 并 将 之 看 作 是 
习 以 为 当 的 事情 一 一 除非 是 出 于 某 些 特殊 原因 , 否则 你 的 进程 完全 可 以 运行 在 相互 独立 的 多 人 台 机 
从 上 ， 这 时 你 便 可 以 开始 设计 在 以 前 看 来 复杂 得 超 乎 想象 的 系统 了 。 

这 两 个 属性 一 一 复制 式 通信 和 位 置 透 明 性 一 一 使 Erlang 分 布 式 编程 真正 成 为 了 一 件 令 人 愉 
悦 的 事情 。 在 下 一 章 中 ,这 些 内 容 午 会 被 用 到 先前 的 缓存 应 用 中 去 。 但 现在 ， 你 的 缓存 是 不 具 
备 网 络 通信 能力 的 。 在 为 一 台 机 带 上 为 外 局 动 一 个 绥 存 实例 ， 两 个 实例 完全 无 法 感知 对 方 的 存 
在 。 为 了 给 绥 存 应 用 添 加 分 布 式 支持 ， 站 和 完 就 要 改变 这 个 局 面 : 这 些 机 天 必须 能 够 感知 对 方 的 
存在 。 
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8.2 ”节点 与 集群 


先前 我 们 故意 模 糊 化 了 一 个 概念 : 我 们 所 讨论 的 机 需 到 底 指 的 是 什么 呢 ? 在 很 多 场景 下 , 一 
套 人 硬件 上 只 会 运行 一 个 Erlang VM (人 参见 1.4 节 六 但 有 些 时 候 一 一 尤其 是 在 测试 和 开发 阶段 ， 你 
需要 在 一 台 计 算 机 上 运行 多 个 VM 实 例 。 按 照 目前 局 动 er1 (或 werl ) 的 方式 运行 起 来 的 VM 实 
例 无 从 知晓 也 不 关心 其 他 实例 的 存在 ,因为 它们 之 间 并 没有 建立 起 网 络 连接 。 在 单 台 计算 机 上 运 
行 多 个 基于 Erlang 的 程序 时 (例如 Yaws Web 服 务 久 和 CouchDB 数 据 库 )， 这 个 模式 是 适用 的 。 启 
用 了 网 络 功能 之 后 ，Erlang VM 跑 起 来 会 更 有 意思 。 我 们 管 这样 的 VM 实 例 叫 作 节 点 。 

一 旦 两 个 或 两 个 以 上 的 Erlang 方 点 能 够 相互 感知 ， 我 们 就 说 它们 形成 了 一 个 集群 。 
(Erlang/OTP 的 官方 文档 通 稼 称 之 为 万 点 网 络 ， 我 们 不 打算 采用 这 个 叫 法 ， 以 免 与 计算 机 网 络 相 
混 消 。) 默认 情况 下 ，Erlang 集 群 是 一 个 全 联通 网 络 ， 如 图 8-4 所 示 。 换 言 之 ， 集 群 中 的 每 个 节点 
都 能 够 感知 其 他 所 有 市 点 ,任意 两 个 节点 都 可 以 直接 通信 。 


Nodel(Wnetwork 
























Node2(Onetwork Node3(Onetwork 









Node4(Onetwork 


图 8-4 经 由 网 络 形成 集群 的 Erlang 节 点 。 集 群 中 的 每 个 布点 都 与 其 他 所 有 下 点 直接 相 
连 : 这 是 一 个 全 联通 网 络 














被 配置 成 按 分 布 式 模式 运行 的 Erlang VM 就 叫 作 节 点 。 每 个 节点 都 有 一 个 节点 名 ， 其 他 节 
点 可 以 通过 这 个 名 字 来 找到 该 节点 并 与 之 通信 。 当 前 本 地 节点 的 节点 名 可 以 通过 内 置 函数 
node () 获取 , 节点 名 是 个 原子 , 格式 为 nodename@hostname。( 不 以 分 布 式 模式 运行 的 VM 
的 节点 名 恒 为 nonode@nohost。) 在 单 台 主机 上 可 以 同时 运行 多 个 节点 。 


8.2.1 点 的 局 动 


只 要 给 erl (或 werl ) 加 上 命令 行 参数 -name 或 -sname， 就 可 以 以 分 布 式 模式 局 动 Erlang 
节点 。 第 一 种 形式 适用 于 配 有 DNS 的 普通 网 络 环境 ， 你 需要 给 出 节点 的 完全 限定 域名 〈fally 
了 以 中 元 于 从 下 只 人 
qualified domain names )。 例 如 : 
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erl -name simple cache 

第 二 种 形式 适用 于 完全 限定 域名 不 可 用 的 情况 ; 在 某 些 生产 环境 下 这 种 环境 也 是 很 常见 的 。 
还 有 的 时 候 , 举 个 例子 , 同 处 一 个 无 线 局 域 网 内 的 两 台 计 算 机 可 以 互联 , 但 偏偏 用 DNS 就 走 不 通 。 
人 碰 到 这 些 情 况 时 ， 你 就 只 能 用 短 节 点 名 了 了 : 

erl -sname simple cache 


只 要 所 有 节点 同 处 一 个 子 网 ， 你 就 可 以 使 用 短 节 点 名 。 














长 短 市 点 名 不 可 混用 
采用 短 节 点 名 和 长 节点 名 的 节点 所 处 的 通信 模式 是 不 同 的 ,它们 之 间 无 法 形成 集群 。 只 有 
采用 相同 模式 的 节点 才能 互联 。 








当 Erlang YM 以 市 点 形态 运行 时 ，shell 提 示 符 中 会 包含 入 点 名 : 
Eshell V5.6.2 (abort with ^G) 
(simple cache@mybox.home.net}1> 


该 节点 名 为 simple_cacheemybox.home.net。 可 以 看 出 它 用 的 是 长 节点 名 (完全 限定 域名 )， 
它 的 启动 参数 为 -name simple_cache。 换 用 -sname simple_cache 局 动 sShell 的 话 ， 节 点 名 中 
主机 部 分 训 句 点 的 内 容 就 都 没 了 ， 如 下 所 示 : 


Eshell] V5.6.2 (abort with ^G) 
(simple cache@mybox}1> 


请 在 自己 的 机 器 上 试验 一 下 这 两 种 模式 。 如 果 用 的 是 Windows， 请 右 击 Erlang 图 标 ， 选 择 属 
性 ， 然 后 在 目标 命令 (C:\.NwerlLexe ) 中 加 上 name 或 sname 人 参数 。 你 也 可 以 在 桌面 上 多 复制 几 个 
图 标 再 分 别 编辑 它们 的 属性 ， 这 样 一 来 只 要 点 点 鼠标 你 就 可 以 用 各 种 不 同 的 节点 名 来 局 动 Erlang 
节点 了 。 

现在 你 已 经 知道 该 如 何 局 动 节 点 了 ， 下 一 步 目 然 就 是 让 它们 相互 通信 。 


























8.2.2 市 扩 的 互联 


Erlang 集 群 由 两 个 或 两 个 以 上 的 节点 组 成 。 就 数量 而 言 ， 在 同一 集群 内 局 动 几 十 个 布点 没什么 
问题 ,但 要 跑 上 几 百 个 的 话 就 比较 惹 了 。 其 原因 在 于 维系 机 带 之 间 的 联络 是 逢 要 一 定 的 通信 开销 的 ， 
而 Erlang 集 群 叉 是 一 个 全 联通 网 络 ， 这 样 一 来 这 部 分 开销 会 随 市 点 数 的 增加 按 平 方 规模 增长 。 








隐形 节点 

借助 一 些 特殊 的 节点 ,我们 可 以 将 多 个 集群 合并 成 更 大 的 、 非 全 联通 的 集群 。 这 类 节点 经 
过 特殊 的 配置 ,不 会 对 外 传播 其 他 节点 的 信息 ,它们 甚至 可 以 对 其 他 节点 隐身 ,以 便 对 集群 进 
行 非 侵 入 式 监控。 





一 个 广 扩 不 会 主动 搭理 其 他 方太 。 你 必须 给 它们 一 个 呼 朋 唤 友 的 理由 ; 然而 一 旦 探测 到 了 别 
的 节点 ， 它 便 会 持续 追踪 它们 并 与 之 交换 已 经 和 自己 建立 了 连接 的 其 他 节点 的 信息 ,从 而 促成 全 
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联通 网 络 的 形成 。 例 如 ,假设 市 点 A 和 BB 组 成 了 一 个 集群 ，c 和 D 组 成 了 为 一 个 集群 ， 如 末 A 和 D 相 
遇 ， 它 们 就 会 互相 交换 B 和 c 的 信息 ， 最 终 4 个 市 点 会 共同 形成 一 个 更 大 的 网 络 ， 正 如 图 8-4 所 示 。 

不 妨 实际 操练 一 下 。 请 分 别 以 a、b、c 为 亨 点 名 启动 3 个 节点 (每 个 市 把 都 位 于 日 己 的 窗口 
内 )。 然 后 按 以 下 顺序 连接 这 些 节 点 : 痛 先 让 a 连接 bp， 然后 让 b 连 接 c。 本 例 中 的 3 个 市 点 是 在 同 
一 台 机 右上 启动 的 , 这 倒 不 是 说 它们 不 可 以 独立 运行 在 单独 的 机 各 上 , 但 那样 做 就 不 得 不 奋 涉 我 
们 尚未 来 得 及 介绍 的 和 安全 模型 相关 的 内 容 。 在 考虑 多 台 计 算 机 的 情况 时 , 市 点 间 的 通信 还 可 能 
会 遭 到 防火 增 的 阻挠 。 价 单 起 见 ， 我 们 先 让 它们 在 一 台 机 带 上 运行 : 

> erl -name a 


Erlang (BEAM) emulator version 5.6.2 [source] [smp:2] [async-threads:0. 
[kernel-poll:falsel] 
































Eshell] V5.6.2 (abort. with ^G) 
(aadmybox.home.net)1> 


请 按 同 样 的 方式 局 动 厄 点 b 和 c。 现在 , 在 各 个 三 点 上 调用 内 置 函 数 nodes (), 检查 一 下 节操 
间 的 互联 情况 。 目 前 它们 返回 的 应 该 和 都 是 空 表 : 


(bamybox.home.net}1> mnoaqes(r ) ，. 
[ 


下 一 步 就 是 让 它们 互联 。 如 果 只 是 要 建立 连接 ， 最 简单 的 方法 就 是 采用 标准 库 呆 数 
net_adm:ping/1， 如 下 所 示 : 


(aemybox .home.net)2> net aqm:plng(' bemybox.home.net ') . 
POoOnNY 


通信 成 功 的 话 该 调用 将 返回 原子 pong, 否则 就 会 返回 原子 pang。( 看 起 来 有 点 儿 怪 , 在 瑞典 
语 中 ，pang 就 是 拟 声 词 “ 踪 ” 的 意思 ， 这 就 好 像 是 在 说 “前 溃 啦 ， 啼 ， 执 行 失败 ”。) 一 切 顺 利 的 
话 ， 市 反之 间 的 连接 应 该 就 建立 好 了 。 你 可 以 分 别 在 3 个 证 点 上 再 次 调用 nodes ( ) 检查 一 下 。 在 
点 a 上 你 应 该 能 够 看 到 b， 反 之 亦 然 。 在 节点 c 上 则 仍然 是 张 空 表 ， 因 为 它 还 没 联络 上 其 他 两 个 
太太 : 


(bamybox.home.net}2> nodes()}. 
['a@mybox.home.net'l] 


如 条 在 所 有 节点 同 处 一 合 机 融 的 情况 下 这 一 步 仍然 走 不 通 , 那么 很 可 能 是 因为 你 采用 了 完全 
限定 域名 ， 却 又 疫 有 配置 好 DNS 。 例 如 在 接 入 了 家 庭 局 域 网 的 某 侣 PC 上 ， 可 能 有 个 名 为 
aemvypc.home .net ' 的 节点 , 然而 DNS 又 解析 不 出 myvpc .home .net 这 个 地 址 。( 可 以 用 ping 等 
常用 命令 行 工 具 检 查 域名 是 否 可 用 。) 如 果 节 点 连 不 上 ， 请 用 -sname 人 代替 -name 再 试 试看 。 

接 春 ， 连 接 b 和 c， 并 再 次 调用 nodqes (): 


(bamybox.home.net}3> net acdm:PpIndf'ceamypbox.home .met ') ， 



































Pong 
(bamybox.home.net)4> nodes{(). 
['a@mybox.home.net', 'ceémybox.home.net’'] 


这 个 结果 并 不 奇怪 : b 已 经 认识 a， 现在 义 知 道 了 c。 在 a 和 c 上 也 运行 一 裔 nodes () ， 你 会 看 到 
整个 集群 已 经 是 一 个 全 联通 的 网 络 了 : 
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(aamybox .home .Pet)4> nodes(}. 
['bamybox.home.net', 'ceémybox.home.net'. 


(camybox.home.net}3> nodes(}. 


['bamybox.home.net', 'a@mybox.home.net'. 
最 后 再 做 一 个 实验 ,干掉 市 点 b( 比如 直接 输入 gq () .; 参见 2.1.4 节 )， 然 后 看 看 在 余下 的 市 
点 a 和 c 上 会 发 生 些 什么 : 


(1aamybox .home .Pet)5> nodes'!(). 
['camybox.home.net'l] 


(camybox.home.net}) 4> nodes (}. 
[aemybox.home .Pet '] 


虽然 最 初 介 绍 这 两 个 节点 认识 的 节点 已 经 不 复 存 在 了 , 但 它们 之 间 的 联络 却 没有 中 断 。 这 时 
如 果 重 启 b 并 令 它 与 a 或 ce 相连 ， 整 个 集群 义 会 恢复 为 3 个 市 点 
这 一 切 是 怎么 运作 起 来 的 呢 一 一 尤其 是 当 市 点 运行 在 多 台独 立 的 机 器 上 时 ， 情况 又 如 何 呢 ? 











8.2.3 Erlang 节点 如 何 定位 其 他 节点 并 与 之 建立 通信 


今 查 一 下 系统 中 运行 着 的 进程 ， 看 看 其 中 有 没有 一 个 叫做 EPMD 的 进程 。 在 类 UNIX 操 作 系 
统 中 ， 你 可 以 用 ps: 


$ ps ax | grep -i epmd 
1758 7? SS 0:00.00 /usr/local/lib/erlang/erts-5.6.2/bin/epmd -daemon 


EPMD 代 表 Erlang 端 口 映 射 守护 进程 (Erlang Port Mapper Daemon )。 你 每 启动 一 个 节点 ， 它 
都 会 检查 本 地 机 器 上 是 否 运 行 着 EPMD ， 如 果 没 有 ， 节 点 就 会 自 和 了 启动 FEPMD。EPMD 会 追踪 在 
本 地 机 需 上 运行 的 每 个 节点 ， 并 记录 分 配给 它们 的 端 口 。 当 一 全 机 硕 上 的 ErlangT 点 试图 与 某 远 
程 节 点 通信 时 ， 本 地 的 EPMD 就 会 联络 远程 机 需 上 的 EPMD (默认 使 用 TCP/ 耻 ， 端 口 为 4369 ),， 询 
问 在 远程 机 器 上 有 没有 叫 相应 名 字 的 节点 。 如 果 有 ， 远程 的 EPMD 就 会 回复 一 个 端口 号 ， 通 过 该 
问 口 便 可 直接 与 远程 方 点 通信 。 不 过 EPMD 不 会 会 自动 搜寻 其 他 EPMD 一 一 只 有 在 某 个 节点 主动 搜 
寻 其 他 节点 时 通信 才能 建立 。 


























更 为 高 级 的 市 护 探测 机 制 


现 有 的 系统 允许 你 通过 网 络 多 播 、 更 为 高 明 的 ee 
EC2 等 可 以 随时 按 需 增删 服务 器 的 云端 环境 下 运行 Erlang 时 "， 你 可 能 就 用 得 有 


Nodefinder 就 是 这 样 一 个 项 目 , 近 期 受 至 ‘ 了 不 少 关注 ,参见 http://code.google. 0 





请 注意 ，Erlang 默 认 的 分 布 式 模型 基于 这 样 一 个 假设 ， 那 就 是 集群 中 的 所 有 节点 都 运行 在 一 
个 受信 了 网络 内 。 如 果 这 个 假设 不 成 立 ， 或 者 其 中 的 某 些 机 器 需要 与 外 界 通信 , 那么 你 就 应 该 直接 
在 TCP (或 UDP、SCTP 等 ) 之 上 配合 恰当 的 应 用 层 协议 来 实现 非 受信 网 络 上 的 通信 。 第 3 章 中 的 
RPC 服 务 融 采取 的 正 是 这 种 策略 。 此 外 ， 你 还 可 以 利用 SSL、SSH 或 IPsec 等 技术 建立 加 密 隧 道 

















(这 意味 着 集群 拓扑 结构 的 变动 会 比较 频繁 。 一 一 译 者 注 
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甚至 直接 将 Erlang 的 分 布 式 通 信 层 架设 在 SSL 等 传输 协议 之 上 〈 详情 参见 Erlang/OTP SSL 库 和 
ERTS 用 户 手 册 )。 

在 典型 的 生产 环境 下 , Erlang 方 点 运行 在 受信 网 络 内 的 多 台 机 右上 , 其 中 的 一 个 或 多 个 市 点 
通过 Yaws、MochiWeb 或 标准 库 中 的 inets httpd 等 Erlang Web 服 务 器 与 外 界 通信 。 在 某 些 端口 
上 你 也 可 能 会 开放 一 些 别 的 协议 。 除 此 以 外 ， 就 别 无 其 他 途径 可 以 从 外 界 访问 你 的 网 络 了 。 然 
而 即便 如 此 ， 一 点 儿 安 全 防护 工作 都 不 做 绝对 是 极为 不 明和 刹 的 ， 哪 旧 仅 仅 是 为 了 防范 人 为 误 操 
作 呢 。Erlang 的 分 布 式 功能 配备 了 一 套 基 于 masgic cookie 的 认证 系统 ， 撒 开 防 火 墙 因素 ， 最 常见 
人 就 是 cookie 设 置 错 误 。 在 下 一 小 市 中 ， 我 们 将 介绍 magic cookie 的 工 

尿 理 。 











8.2.4 magic cookie 安全 系统 


找 一 台 机 大 ， 在 其 上 启动 Erlang 广 点 ， 并 确保 至 少 成 功 启 动 过 一 次 ， 人 然后 观察 一 下 用 户主 日 
录 。( 在 Windows 上 ， 该 日 录 一 般 是 C:/Documents and Settings/<username> 或 C:/Users/<username>， 
总 之 束 是 8HOMEDRIVE%%HOMEPATH% 展 开 后 的 结果 。) 你 应 该 会 看 到 一 个 名 为 .erlang.cookie 的 文 
件 。 在 文本 编辑 希 中 打开 该 文件 ， 你 会 看 到 一 个 长 长 的 字符 串 。 它 就 是 Erlang 目 动 为 你 生成 的 
cookie。 在 shell 中 可 以 用 以 下 命令 检查 当前 Erlang 节 点 的 cookie: 


(bamybox.home.net}1> auth:get cookie(}. 
'CUYHOMJEJEZLDUETUOWEH.' 


返回 的 字符 串 应 该 与 你 在 .erlang.cookie 文 件 中 看 到 的 相同 。Erlang 广 点 只 有 在 知晓 其 他 市 点 
的 magic cookie 的 情况 下 才能 与 它们 通信 。 节点 在 启动 时 会 尝试 读 取 .erlang.cookie 文 件 ， 如 果 文 件 
存在 ， 它 就 会 拿 文 件 中 的 字符 串 当 作 目 己 的 magic cookie。( 修改 该 文件 中 的 字符 冲 并 重 局 节点 ， 
重新 执行 上 述 命令 , 你 就 会 看 到 修改 后 的 字符 串 。) 如 果 找 不 到 , 市 点 会 新 建 一 个 cookie 文 件 并 写 
人 一 个 随机 字符 串 这 就 是 cookie 文 件 最 初 的 来 历 。 试 验 一 下 : 删除 该 文件 并 重启 和 点 ， 你 会 
发 现 该 文件 市 着 新 的 随机 字符 串 又 再 次 出 现 了 。 

默认 情况 下 , 每 个 节点 都 会 假定 所 有 与 日 己 打交道 的 节点 都 拥有 和 自己 一 样 的 cookie。 此 前 ， 
当 你 在 单 台 机 天 上 (使 用 相同 的 用 户 账 喜 和 主 目 录 ) 局 动 多 个 和 点 时 ， 所 有 世上 点 都 共享 同一 个 
cookie 文 件 ， 因 此 它们 之 则 是 可 以 相互 通信 的 。 要 让 运行 于 两 台 不 同 机 带 上 的 节点 相互 通信 ， 最 
简单 的 办 法 就 是 将 其 中 一 台 机 六 随机 生成 的 cookie 文 件 复制 到 男 一 人 台 上 ， 这 样 做 一 方面 可 以 保证 
两 个 节点 具有 相同 的 cookie， 一 方面 也 可 以 保证 该 cookie 不 易 被 攻击 者 猿 中 。 此 外 ， 除 文件 所 有 
者 以 外 的 其 他 用 户 只 应 拥有 该 文件 的 旋 权 限 。 

这 个 安全 模型 可 以 抵御 一 些 简 单 攻击 一 一 例如 ， 即 便 是 在 不 受 防 火 墙 保护 的 计算 机 上 启动 
Erlang 广 点 ， 攻 击 者 也 无 法 轻 多 猿 中 你 的 cookie; 然而 更 为 重要 的 是 ， 它 还 可 以 有 歼 防 范 人 为 误 
操作 。 假 设 网 络 中 运行 着 两 个 独立 的 ErlangT 点 集群 ， 同 时 出 于 某 些 原因 你 又 不 布 鹿 它们 一 不 小 
心 合 并 成 单个 全 联通 的 集群 ( 比如 这 两 个 集群 之 间 存 在 齐 宽 瓶 锅 )。 只 要 设置 不 同 的 cookie, 你 就 
可 以 确保 这 两 个 集群 中 的 成 员 不 会 意外 地 因 net_adm:ping(...) 等 原因 而 互联 。 
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连接 多 台 计 算 机 

找 两 台 在 网 络 上 相互 连接 的 装 有 Erlang 的 计算 机 (数量 越 多 越 好 ), 然后 重复 8.2.2 节 中 的 
步 又。 首先 确 保 两 边 的 cookie 文件 就 绪 ; 然后 在 两 人 台 机 器 上 各 启动 至 少 一 个 节点 ， 再 调用 
net_adm:ping/1， 这 样 就 可 以 完成 互联 了 。 


对 于 更 为 复杂 的 配置 , 你 也 可 以 借助 内 置 困 数 set_cookie (Node,Cookie) 通 过 编程 手段 来 
设置 cookie。 采 用 这 种 方式 ， 节 点 可 以 用 不 同 的 cookie 与 不 同 的 节点 通信 。 原 则 上 说 ， 和 集群 中 
个 节点 的 cookie 都 可 以 不 同 ， 但 在 实践 中 整个 系统 往往 会 共用 一 个 cookie。 

接 下 来 ,不妨 让 你 的 节点 相互 联络 联络 ， 看 看 在 分 布 式 环境 下 Erlang 的 消息 传递 机 制 都 能 
些 什么 作为 。 


8.2.5 ”互联 市 点 间 的 消息 传 囊 


在 第 1 音 和 第 2 章 中 , 我 们 简单 介绍 了 如 何 用 ! 和 receive 来 进行 消息 传递 。 在 此 后 的 草 市 中 ， 
你 又 体验 了 用 gen_server:cast(...) 等 API 困 数 发 送 消 息 的 方法 。 现 在 我 们 来 考察 跨 节 点 的 消 
县 传递 。 请 局 动 节点 a、b、c 并 按 之 前 的 步骤 令 它 们 互联 。( 值得 兴奋 的 是 ， 这 一 次 每 个 斑点 都 
可 以 运行 在 单独 的 机 硕 上 了 。) 完 整地 跑 一 迄 下 面 的 示例 , 你 便 会 知道 在 Erlang 中 分 布 式 编程 是 多 
么 简单 。 
我 们 首先 要 演示 的 是 如 何 与 远程 节点 上 的 注册 进程 通信 。 在 贡 点 b 上 输入 以 下 命令 〈 还 记得 
每 个 表达 式 的 末尾 都 得 加 上 一 个 句点 ， 光 在 行 尾 敲 回 车 是 行 不 通 的 小 


(Penmvybox .home .net)2> redlisterlshel1l，selft()) ， 
七 工 U 


















































吧 


3 


(ba@mybox.home.net} 3> receive 

(bamybox,home.net)3> {From, Msg} -> 
(bamybox.home.net) 3> From ! {self(}, "thanks"}, 
(beEmybox.home.net)3> io:format('"Msg: ~p~n", [Msg]! 
(bamybox.home.net) 3> end. 





在 第 一 个 提示 符 下 ， 你 本 地 节点 上 注册 了 shell 进 程 ， 注 册 名 为 shel1。( 有 关 进 程 注 册 的 详 
情 请 参见 2.13.3 节 。) 注册 函数 返回 true 以 示 成 功 。 楷 接着 是 一 个 eceive 表 达 式 ， 敲 完 最 后 一 
行 的 句点 ， 回 车 ，shell 没 能 像 往 常 那样 打印 出 下 一 个 提示 符 一 一 它 正 在 执行 Teceive， 等 待 着 能 
与 模式 {From，Msg} 匹 配 的 消息 的 到 来 。 模 式 中 的 From 应 该 是 个 进程 标识 符 ， 可 用 于 癌 消 息 发 
送 方 发 送 应 答 ; Msg 则 可 以 是 任意 数据 。 一 旦 收 到 符合 条 件 的 消息 ，shell 进 程 首先 会 将 目 身 的 进 
程 标识 符 作 为 应 答 回复 给 发 送 方 ， 紧 接 独 打印 出 接收 到 的 Msg。 等 这 一 切 全 部 执行 完毕 之 后 ， 你 
才能 继续 在 shell 中 输入 表达 式 ， 所 以 现在 可 以 暂且 把 它 放 到 一 边 了 。 

接 下 来 ， 请 在 方 点 c 上 重复 上 述 步 妊 。 至 此 ，b 和 c 痢 进入 了 阻塞 状态 ， 等 竺 着 消息 的 到 来 。 
现在 请 切换 至 节点 a， 并 输入 以 下 内 容 : 




















(a@mybox.home.net}2> lists:foreach{(fun{Node) -> 

(agmybox.home.net)})2> {shell, Nogde} I {self(}, "hello!"} 
(a@mybox.home.net)})2> end, 

(a@mybox.home.net)})2> nodes {))., 
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上 述 表 达 式 用 高 阶 图 数 1ists :foreach/2 遍 历 了 一 张 列 表 ， 该 列表 由 nodqes () 返 回 ， 其 中 
] 含 与 当前 节点 建立 了 连接 的 所 有 市 点 , 目前 该 列表 中 应 包含 b 和 c。 在 遍历 的 过 程 中 , 你 癌 列 表 

中 每 个 节点 上 的 一 个 特定 的 目标 进程 发 送 了 一 条 消息 {self()，"hello!"}, 该 目标 进程 由 元 
组 {shell，,，Node} 表 示 。 在 2.13.3 市 我 们 未 曾 提 及 消息 的 这 种 目标 进程 表示 法 ， 它 表示 消息 应 该 
发 送 给 指定 节点 上 的 注册 名 为 shell 的 注册 进程 。 如 果 不 这 么 写 ， 而 只 是 写成 shell ! {...} 的 
话 ， 消 息 将 会 被 发 送 给 本 地 市 点 a 上 的 注册 进程 ， 这 可 不 是 你 在 此 处 想 要 的 结 

反观 为 外 两 个 市 点 ,它们 应 该 各 上 自 收 到 了 一 条 消息 , 并 且 遵 照 你 的 指示 癌 发 送 方 发 送 了 应 答 
并 打印 出 了 消息 内 容 。 这 两 个 节点 应 该 有 如 下 表现 : 

Msg: "hellol!l” 


Ok 
(beamybox.home.net)4> 


请 注意 ， 在 前 面 的 receive 表 达 式 中 ， 你 将 发 送 方 的 pid 绑 定 到 了 变量 From 上 。 不 妨 在 shell 中 检 
全 一 下 : 


(bamybox.home.net})4> From. 
<5135.37.0> 


这 就 是 进程 标识 符 的 文本 表述 形式 。 由 第 一 个 数值 可 以 看 出 , 它 指 代 的 是 一 个 位 于 外 来 节点 
上 的 进程 一 一 对 于 本 地 进程 而 言 ，pid 中 的 这 个 数值 一 定 是 零 。 请 注意 ， 在 用 这 个 pid 回 发 送 方 发 
送 应 答 的 时 候 ， 直 接 使 用 From ! {...} 就 可 以 了 ， 无 须 指明 进程 所 在 的 节点 。 目 标 节点 的 位 置 
言 息 已 经 隐 含 在 pid 中 了 。( 不 用 太 在 意 pid 中 的 各 个 具体 数值 一 一 它们 不 过 是 一 些 临 时 分 配 的 量 ， 
没有 什么 更 深层 次 的 含义 。) 在 节点 c 上 重复 上 述 步 又 ， 你 会 看 到 c 上 的 From 和 b 上 的 是 一 样 的 。 

不 过 ， 那 些 应 答 消 息 都 到 哪儿 去 了 呢 ? 很 容 单一 一 它们 都 在 节点 a 的 shell 进 程 的 信箱 里 排队 
呢 。 首 先 我 们 来 看 看 shell 进 程 的 ID: 


(a@mybox.home.net}3> Selft() . 
<O.37.0> 


拿 这 个 ID 和 其 他 节点 上 的 Frzom 做 个 对 比 ， 你 会 发 现 它 们 中 间 的 数值 是 相等 的 。 不 过 这 个 ID 的 第 
一 个 数值 为 零 ， 这 表示 该 进程 运行 于 本 地 节点 上 。 现 在 ， 再 来 看 看 a 上 的 信箱 : 

(aamybox.home .net)4> receive R1L -> R1 end. 

{<5316.37.0>, "thankes"} 


(aamybox.home .net)5> receive R2 -> R2 end. 
{<S5229.37.0>, "thanks"} 


( 记 住 ,两 个 receive 一 定 要 使 用 不 同 的 变量 一 一 否则 第 二 个 匹配 会 失败 。) 请 注意 ， 两 个 消 
息 发 送 方 的 pid 都 是 远程 pid， 它 们 的 第 一 个 数值 都 不 为 零 。 有 意思 的 是 ， 这 两 个 pid 与 a 上 shell 进 
程 的 pid 在 第 二 个 数值 上 都 相等 。 这 是 因为 在 每 个 节点 的 启动 过 程 中 , 初始 shell 进 程 的 启动 时 机 基 
本 上 都 是 一 样 的 。 如 果 某 个 节点 上 的 shell 进 程 朋 省 并 重启 , 对 应 的 数值 会 产生 变化 。 你 可 以 试 试 ， 
在 a 上 输入 1=2.， 人 然后 再 调用 self () ， 就 可 以 看 到 pid 变 了 : 在 Erlang 中 ， 连 shell 都 是 采用 进程 来 
进行 容错 的 。( shell 进 程 崩 淡 后 ( 日 变量 绑 定 关系 仍然 会 保留 。) 

如 你 所 见 ，Erlang 的 分 布 式 通信 非常 人 简单， 后续 也 不 会 出 现 更 为 复 洒 的 内 容 了 。 这 些 就 是 它 
的 全 部 精髓 所 在 , 剩 下 的 无 非 都 是 些 锦上添花 的 东西 轩 了 。 在 正式 开始 分 布 式 编程 之 前 我 们 还 有 
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一 个 重头 戏 ， 那 就 是 学 习 如 何 通 过 本 地 终端 来 远程 控制 其 他 节点 。 
一 
8.2.6 ”使 用 远程 shell 


远程 访问 shell 的 能 力 是 Erlang 位 置 透明 性 的 一 个 绝 佳 例 证 。 说 到 底 ， 局 动 一 个 普通 的 Erlang 
shell， 实 际 上 就 是 启动 了 一 个 可 以 与 终端 窗口 的 输入 输出 流 进 行 对 话 的 Erlang 进 程 。 此 间 的 通信 
也 是 信 由 消息 传递 实现 的 , shell 进 程 并 不 关心 与 自己 相连 的 终 问 是 否 和 自己 同 处 一 个 方 点 。 因 此， 
我 们 完全 可 以 在 远程 节点 上 启动 一 个 shell 进 程 , 令 它 与 本 地 节点 上 的 终端 相连 ， 然 后 在 其 中 完成 
各 种 工作 。 

Erlang shell 的 任务 控制 接口 直接 可 以 支持 远程 shell 功 能 。 回 顾 一 下 2.1.4 节 的 内 容 ， 在 shell 中 
键入 Gtrl-G 便 可 以 进入 以 下 提示 符 : 


User switch command 








> 


请 在 节点 a 上 执行 该 操作 。 在 提示 符 下 键入 hp 或 ?， 可 以 看 到 帮助 文本 : 








C [nn] - connect to job 

i [nn] - interrupt job 

k [nnl] - kill job 

] - list all jobs 

s [shelll] - start local shell 
r [node [shell]] - start remote shell 
el - dquit erlang 

? h - this message 


我 们 曾 在 2.1.5 节 中 解释 过 如 何 使 用 任务 控制 ， 但 当时 我 们 并 没有 对 命令 进行 介绍 。 现 在 你 
大 概 已 经 猜 到 了 。 我 们 将 要 在 节点 a 上 启动 一 个 在 节点 b 上 运行 的 任务 。 节 点 之 间 事 对 甚 至 无 须 建 
立 连接 ， 只 要 你 乐音， 完全 可 以 随意 重 局 方太 bp。 请 在 a 上 输入 : 


-> Ir ‘beémybox.home.net,' 
一 一 > 


r 命 令 以 单个 节点 名 为 参数 ， 在 与 该 节点 名 对 应 的 节点 上 局 动 一 个 远程 shell 任 务 ， 其 过 程 与 
用 s 命 令 启动 一 个 新 的 本 地 任务 类 似 。 如 采 布 点 名 中 含有 句点 (本 例 中 就 是 ), 请 务必 用 上 单 引 号 。 
和 使 用 s 命 令 时 一 样 ， 该 命令 不 会 立即 见效 。 请 用 j 命 令 检查 一 下 当前 正在 运行 的 任务 : 
--> jj 
1 {shell,start, [init]} 


2* {'bamybox.home.net',shell,start,[]} 
> 


任务 1 就 是 原 有 的 本 地 shell， 注 意 一 下 任务 2: 结果 显示 该 任务 运行 在 节点 b 上 。 接 下 来 请 输 
入 c2 连 接 该 任务 一 一 不 过 ， 正 如 * 标 记 所 指示 的 那样 ，2 写 任务 就 是 默认 任务 ， 因 此 耻 接 输入 c 束 
可 以 了 : 


Eshell V5.6.5 (abort with ^G) 
(bamybox.home.net)}1> 


看 一 下 提示 符 , 你 已 经 跑 在 市 点 5 上 了 ! 这 意味 看 无 论 b 所 处 的 机 带 是 在 隔壁 房间 还 是 远 在 地 


























图 灵 社 区 会 员 for(;)(13433955876@163.com) 专 享 尊重 版 权 





174 第 8 齐 分布 式 Erlang/OTP 简介 





球 的 男 一 端 ,你 部 可 以 像 坐 在 节点 b 的 终端 前 一 样 在 b 上 执行 任何 命令 。 其 中 也 包括 各 种 维护 工作 ， 
如 手工 终止 或 重启 进程 、 代 码 编译 和 升级 以 及 监视 或 调试 等 。 功 能 绝对 强大 ! 但 能 力 越 大 责任 也 
越 大 ， 一 不 小 心 的 话 你 也 很 可 能 让 节点 宕 机 。 








退出 远程 shell 时 干 万 要 小 心 
使 用 完 远程 shell 打算 退出 时 ， 你 的 手指 可 能 不 自觉 地 就 敲 出 了 gq() .， 停 ! 千 万 别 回 车 ! 
这 个 命令 是 init:stop() 的 简写 ， 用 于 关闭 执行 该 命令 的 节点 : es 奴 怕 
每 个 Erlang 人 二 头 绊 过 。 要 想 安 全 退出 ， 请 使 用 Ctrl-G 和 Ctrl-C (或 
Ctrl-Break )， 这 两 个 组 合 键 只 对 本 地 节点 有 效 。 键 入 Ctrl-G 加 Q, 或 Ctrl-C (在 Windows 上 是 
Ctrl-Break ) 加 A， 都 可 以 在 不 影响 远程 节点 的 情况 下 关闭 本 地 节点 。 





一 般 情 况 下 ， 你 会 在 某 台 机 右上 保留 一 个 长 期 运行 的 节点 ， 时 而 对 它 进行 一 些 维护 。 为 此 ， 
你 可 以 在 本 地 机 带 上 局 动 一 个 新 的 临时 字 态 ， 然后 通过 该 节点 远程 连接 至 目标 方 点 。 维护 工 作 完 
成 后 ,一般 就 没有 必要 保留 临时 节点 了 ， 连 按 两 次 Ctrl-C 即 可 退出 (这 说 的 是 类 UNIX 系 统 ， 在 
Windows 上 可 以 用 Ctrl- ee )。 这 种 做 法 可 以 强制 终止 临时 节点 ， 同 时 结束 远程 任务 。 如 果 
你 还 打算 保留 本 地 节点 ， 则 可 以 键入 Ctrl-G， 连 接 并 返回 原先 的 shell 会 话 ， 随 后 你 可 以 选择 结 
远程 任务 ， I 之 间 来 回 切换 。 运 行 远程 shell 时 的 实际 交互 如 图 8-5 所 示 。 


计算 机 A 计算 机 B 





Erlang 方 点 X@a Erlang 节 点 








图 8-$ ”远程 shell 的 工作 原理 。 远 程 shell 虽 然 运 行 在 计算 机 B 上 ， 但 它 与 计算 机 A 上 的 本 
地 shell 进 程 一 样 ， 是 与 A 上 的 终端 相连 的 。 多 亏 了 Erlang 的 位 置 透 明 性 ， 这 两 种 
情况 几乎 没有 什么 区 别 


现在 ， 你 已 经 在 分 布 式 Erlang 方 面 打 下 了 坚实 的 基础 。 我 们 介绍 了 了 Erlang 的 分 布 式 模型 和 诈 
点 的 启动 、 互 联 方式 ， 了 解 了 安全 模型 和 cookie 的 设置 方法 ， 学 会 了 在 节点 间 发 送 消息 ， 还 掌握 
了 远程 shell。 在 后 续 的 董 方 中 ， 这 些 知识 将 助 你 一 辟 之 力 ， 协助 你 将 这 些 功能 特性 综合 运用 到 你 
日 己 的 系统 中 去 。 下 一 章 我 们 将 回 到 Simple Cache 应 用 ， 不 过 在 此 之 前 ， 不 妨 再 来 找 点 儿 乐 子 施 
展 一 下 拳脚 。 

假设 你 在 网 络 上 跑 着 一 个 Erlang 集 群 ， 在 该 集群 上 又 运行 着 一 大 把 功能 各 寞 的 服务 。 当 一 个 
服务 需要 访问 临近 服务 时 , 它 如 何 才 能 找到 目标 服务 呢 ?” 要 是 有 一 套 资源 探测 系统 ,可 以 目 动 处 
理 这 些 问 题 该 多 好 。 这 样 一 来 在 集群 内 迁移 服务 时 电 不 就 省 事 儿 多 了 ? 
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你 可 能 在 想 :“ 资 源 探测 可 没 那么 简单 ， 至 少 也 得 写 上 10 000 行 代码 才能 搞定 吧 ， 而 且 还 免 
不 了 要 用 上 AF INET、SOCK DGRAM 之 类 的 星 梁 的 东西 。 别 担心 一 一 要 知道 你 正在 学 的 可 是 
Erlang， 不 用 花费 多 少 力 气 就 可 以 用 一 大 把 功能 强劲 的 东西 打出 一 套 组 合 养 。 


8.3 ”资源 探 出 攻略 


开发 网 络 应 用 时 最 简单 的 一 种 做 法 就 是 将 网 络 上 各 种 资源 的 位 置 都 硬 编码 到 代码 中 ,但 这 样 
做 的 话 , 一 旦 需要 添加 、 迁 移 或 移 除 各 种 资源 ， 你 就 必须 手工 调整 硬 编码 的 配置 信息 (实施 变更 
的 原因 可 以 有 很 多 ， 包 括 服务 扩展 、 重 组 、 故 障 实例 替换 、 代 人 码 升 级 等 )。 作 为 一 名 合格 的 软件 
工程 师 , 你 可 能 会 将 这 些 信息 汇总 到 配置 文件 或 数据 库 中 。 但 你 硅 是 犯 懒 ,直接 将 这 些 内 容 写 进 
了 代码 , 那 就 必须 修改 并 重新 编译 相应 的 模块 了 。 无 论 是 哪 种 情况 ,这 个 手工 调整 的 过 程 总 是 既 
低 效 又 容易 出 错 ， 而 且 随 着 资源 的 迁移 和 配置 的 变更 还 时 常会 把 人 搞 得 尝 头 转向 。 

与 其 采用 便 编 码 , 不 如 引入 一 套 资 源 探测 机 制 , 让 服务 的 供应 方 和 需求 方 无 须 预 先知 晓 系统 
的 布局 便 可 以 相互 定位 。 在 这 一 节 中 ， 你 将 构建 一 个 资源 探测 应 用 ， 其 功能 有 点 儿 类 似 于 黄页 。 
集群 中 的 每 个 节点 都 在 本 地 运行 一 个 该 应 用 的 实例 。 每 个 实例 不 断 地 探测 和 缓存 集 群 中 的 各 种 有 
效 资 源 。 这 种 分 布 式 的 、 动 态 的 途径 可 以 令 系 统 更 为 灵活 和 强大 ， 原 因 如 下 : 

口 无 单 点 一 一 这 是 一 套 点 对 点 的 系统 ; 

口 无 硬 编 码 的 网 络 拓 扑 一 一 你 可 以 随处 添加 资源 ; 

口 易于 伸缩 一 一 你 可 以 随时 加 入 更 多 资源 ; 

口 可 以 在 单个 节点 上 运行 多 个 服务 一 一 整个 探测 过 程 是 位 置 透 明 的 ， 完 全 可 以 在 单个 节点 

上 运行 (该 特性 尤其 适合 于 测试 ); 
口 易于 升级 一 一 可 以 动态 完成 旧 服 务 的 关闭 和 新 服务 的 启动 。 移 除 的 服务 会 被 注销 ， 新 服 
务 上 线 后 很 快 便 会 被 探测 到 。 

资源 一 旦 可 以 被 动态 探测 ， 从 开发 到 上 线 的 全 过 程 就 都 变 得 简单 了 ( 尤其 是 上 线 )。 在 着 手 

实现 之 前 ， 让 我 们 先 来 澄清 一 些 概念 。 

































































8.3.1 术语 


为 了 明晰 后 续 的 讨论 ， 我们 需要 先 介 绍 一 些 概 念 。 它 们 其 实 痢 是 些 非常 通用 的 概念 ， 只 是 
不 同 的 文献 和 实现 各 有 各 的 叫 法 。 资 源 探测 ， 就 是 建立 资源 提供 方 和 资源 使 用 方 之 间 的 关系 。 
为 此 ,你 需要 同时 跟踪 资源 提供 方 的 供给 和 资源 使 用 方 的 需求 : 换 句 话说 ， 就 是 要 将 每 个 参与 
者 的 “供给 ”(I have ) 和 “需求 ”(I want ) 整理 成 一 张 列表 并 加 以 维护 。“ 供 给 ”列表 中 的 条 
目 必 须 包含 可 直接 使 用 和 定位 的 具体 的 资源 ， 而 “需求 ”列表 中 的 条 目 则 只 需要 指明 所 需 资源 
的 类 型 就 可 以 了 ( 以便 探 测 匹 配 的 资源 实例 的 发 现 )。 表 8-1 对 我 们 将 要 用 到 的 各 种 术语 做 出 了 
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表 8-1 资源 探测 相关 的 术语 及 其 定义 


术 语 定 义 

资源 某 个 具体 的 资源 (如 fun 函 数 ) 或 指 代 某 个 具体 资源 的 引用 (如 pid) 
资源 类 型 资源 的 分 类 标签 

资源 元 组 由 类 型 标签 和 资源 组 成 的 二 元 组 


下 面 让 我 们 来 详细 分 析 一 下 这 些 概念 。 


1. 资源 

所 谓 资 源 ， 就 是 某 个 特定 的 、 具 体 的、 可 以 直接 使 用 的 东西 ， 比 如 一 个 Eun 函数 或 是 一 段 二 
进 制 数据 ， 也 可 以 是 用 于 指 代 某 个 具体 资源 的 引用 ， 比 如 pid、 文 件 句柄 、ETS 表 句柄 等 。 一 般 来 
说 ， 我 们 存储 的 都 是 系统 中 的 资源 的 引用 ， 而 不 是 资源 本 喘 。 

2. 资源 类 型 

资源 类 型 用 于 标识 特定 种 类 的 资源 。 例 如 ， 在 以 资源 的 形式 对 外 发 布 Simple Cache 应 用 的 一 
个 实例 时 ， 可 以 将 其 标记 成 simple_cache 类 型 的 资源 。 在 Erlang 集 群 内 ， 同 一 类 型 的 资源 可 以 
有 多 个 实例 ， 无 论 及 用 什么 方式 实现 ， 同 一 类 的 资源 都 应 该 具有 相同 的 API。 如 果 有 谁 声称 目 己 
在 寻找 simple_cache 类 型 的 资源 ， 那 么 它 便 能 查 得 集群 中 发 布 的 这 一 类 型 的 所 有 资源 实例 。 

3. 资源 元 组 

资源 元 组 是 由 资源 类 型 和 资源 共同 构成 的 二 元 组 。 拿 到 了 资源 元 组 ， 就 等 于 拿 到 了 该 资源 。 
其 中 资源 类 型 指明 了 资源 的 种 类 和 访问 方式 。 通过 资源 探测 系统 , 你 可 以 以 资源 元 组 的 形式 发 布 
任何 资源 。 任 何人 只 要 能 够 识别 相应 的 类 型 标签 ， 就 可 以 定位 并 访问 这 些 资源 。 

搞 清楚 了 这 些 术语 , 就 可 以 开始 看 手 实 现 了 。 这 套 系 统 并 不 人 简单 一 一 分 布 式 应 用 都 不 简单 一 一 
不 过 你 一 定 能 行 。 首 先 我 们 要 介绍 的 是 其 中 的 算法 。 















































8.3.2 算法 


假设 你 启动 了 两 个 相互 连接 的 节点 a 和 b ( 且 二 者 已 经 完成 了 资源 信息 的 同步 )， 现 在 集群 中 
又 加 入 了 第 三 个 证 扩 c。 你 所 要 解决 的 就 是 c 与 其 他 市 点 之 间 的 资源 信息 同步 问题 。 假 设 a 和 b 各 
日 持 有 一 些 x 类 型 和 y 类 型 的 本 地 资源 实例 ( 我 们 以 x@a 这 种 形式 指 代 这 些 特定 的 实例 ) 同时 a 和 
b 还 需要 z 类 型 的 资源 。( 比如 z 可 能 是 运行 于 a、pb 上 的 应 用 所 需要 访问 的 日 志 服 务 。) 节点 c 持 有 
一 个 z 类 型 的 本 地 资源 ， 需 要 一 个 或 多 个 x 类 型 的 资源 ,但 不 关注 y 类 型 的 资源 。 

为 了 与 其 他 方 点 你 持 同 步 ，c 上 的 资源 探测 服务 可 会 器 a 和 pb 发 送 消 上 月， 告知 它们 日 己 所 持 有 
的 本 地 资源 。 节 点 a 和 b 上 的 资源 探测 服务 表 收 到 这 些 消 息 后 会 缓存 奖 合 目 己 需求 的 资源 zec。 随 
后 ， 它 们 也 会 把 自己 的 本 地 资源 状况 告知 给 c，c 会 缓存 x 类 型 的 资源 ， 并 忽略 y 类 型 的 资源 。( 这 
就 好 像 是 在 玩 “ 你 说 我 就 说 !” 的 游戏 一 样 。) 期 间 的 交互 过 程 如 图 8-6 所 示 。 

在 进入 下 一 小 市 之 前 请 务必 仔细 阅 谈 上 述 内 容 。 搞 明白 了 这 个 算法 ,理解 下 面 的 实现 就 不 难 了 了 。 

接 下 来 ,我们 就 要 来 实现 资源 探测 系统 的 主 框 染 了 。 在 谈 完 本 书 之 后 ， 你 会 发 现 这 和 套 系 统 在 
很 多 地 方 虱 大 有 用 武之 地 。 
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a b C 
我 持 有 一 个 x 和 我 持 有 一 个 x 和 一 
9 我 需要 人 我 需要 一 1 我 持 有 一 个 z， 
我 需要 一 个 x 
c 告 知 a 和 b 它 有 一 
个 类 型 为 z 的 资源 
ZQCc 


国 | 缓存 zec | 缓存 zec 


将 a 持 有 的 资源 回复 给 c | 将 b 持 有 的 资源 回复 给 c 


< 缓存 x@a 和 x@b 





图 8-6 ”资源 探测 算法 。 节 点 c 正 在 加 入 集群 ;， 它 持 有 a 和 b 所 需 的 z 类 型 的 资源 ， 同 时 


8.3.3 ”实现 资源 探测 应 用 


整套 系统 的 实现 都 以 Erlang 的 消息 传递 为 基础 。 实 现 手段 当然 不 止 一 种 ， 比 如 我 们 也 可 以 采 
用 网 络 多 播 或 广播 , 但 那 就 超出 了 本 书 的 范畴 了 。 为 了 保证 该 练习 的 简洁 性 和 针对 性 ,我 们 将 省 
略 监督 和 日 志 相 关 的 功能 ,把 所 有 代码 都 放 到 一 个 模块 中 。( 在 erlware.org 上 还 有 一 个 功能 更 为 完 
备 的 版 本 ， 和 你 在 前 几 章 中 开发 的 应 用 一 样 ， 那 是 一 个 真正 的 多 模块 的 OTP 应 用 。 ) 

1. 模块 首部 

现在 看 来 ， 这 个 模块 训 无 疑问 应 该 用 gen_servezr 行 为 模式 来 实现 。 除 了 trade_re- 
sources/0 等 应 用 相关 的 API 函 数 以 外 ， 下 列 的 模块 首部 代码 你 应 该 很 是 眼熟 了 吧 : 


-modGdule (resource discovery). 

















-behaviour (gen server). 


-export (| 
start link/0, 
add_ target_resource type/l1, 
adqd local resource/2, 
fetch resources/!], 
trade resources/0 


] 本 


-export([init/l1l, handle call/3, handle cast/2, handle_info/2, 
terminate/2, code change/3]). 


-define (SERVER, ?MODULE). 


在 模块 首部 的 末尾 ， 和 定义 了 进程 状态 记录 : 
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一 工会 COT 1 SBatLG，TfLarGetL resource types, 
Jocal resource tuples, 
found resource tuples})}). 


此 处 一 共 定 义 了 3 个 字段 : target_resource_types 就 是 上 述 的 “需求 ”列表 ， 这 是 一 张 
你 所 需 资 源 的 类 型 的 列表 ; local_resource_tuples 则 是 “供给 ”列表 ,这 张 列表 以 资源 元 组 
的 形式 保存 着 本 地 节点 上 的 所 有 资源 ; 最 后 ， found _ resource tuples 用 于 缓 存 探测 到 的 可 以 
满足 你 的 需求 的 资源 实例 ( 其 中 某 些 实例 有 可 能 就 位 于 本 地 市 点 上 )。 

2. 服务 器 的 启动 和 信息 存储 

接 下 来 就 该 编写 API 函 数 了 。 首 先 就 是 start_l1ink/0， 该 函数 的 实现 可 以 直接 照搬 前 面 的 
章节 

start link(} 一 > 

gem_server:start_ link({local, ?SERVER}, ?MODULE, [], []) 


一 如 往常 , 为 了 让 本 地 进程 和 和 远程 进程 都 能 够 便捷 地 用 进程 名 访问 服务 , 你 需要 在 本 地 注册 
服务 需 进 程 。 写 完 start_1Link() 下 一 个 自然 就 是 启动 过 程 中 会 用 到 的 init/1 回 调 了 : 
init([]} -> 


{ok, #state{ftarget_resource types 
local_resource tuples 





























[] ， 
dict:newt{(}, 
dict:new!(}}}. 


此 处 定义 了 服务 硕 的 初始 状态 : target_resource_types 字 段 被 初始 化 为 一 张 空 表 ， 
foundq_tresoutrce_tuples 和 1Local_resource_tuples 出 由 标准 库 中 的 dict 模块 分 别 初 始 化 成 
空 字典 〈《 即 关联 数组 )。 

到 这 一 步 为 止 ， 服务 胡 局 动 相关 的 欣 辑 就 完成 了 。 现 在 再 加 两 个 API 也 数 ， 它 们 的 功能 很 类 
似 ， 所 以 放 在 一 起 。 这 两 个 函数 都 会 通过 发 送 异 步 请 求 来 将 新 数据 写 和 人 服务 天 状态 : 

add target resource tLypPe(TyPe) 一 > 

gen server:cast (2?2SERVER, {add target resource type, Typel}}). 


found resource tuples 








add_local_ resource(Type, Instance) -> 
Gen server:cast (?SERVER, {add local resource, {Type, Instance}l})}). 


这 两 个 国 数 分 别 用 于 加 “需求 ”和 “供给 ”列表 中 追加 条 目 。 第 一 个 因数 用 于 辐 “ 需 求 ” 列 
表 中 添加 一 个 资源 类 型 。 第 二 个 函数 则 用 于 添加 位 于 本 地 节点 上 的 资源 实例 , 在 添加 的 同时 还 会 
给 该 资源 打上 相应 的 类 型 标签 。 作 为 编程 风格 上 的 一 个 约定 ， 两 个 函数 发 送 的 都 是 {Tag, Data]} 
格式 的 二 元 组 ， 其 中 Data 本 号 可 能 也 是 个 具有 多 个 字段 的 元 组 ， 比 如 {Type，Instance}。 二 
元 组 {Tag，Field1，Field2} 当 然 也 可 以 用 , 但 出 于 一 任性 考虑 ， 我 们 不 打算 混用 不 同 长 度 的 
元 组 ， 而 是 统一 用 标签 二 元 组 作为 协议 消息 格式 。 

这 两 个 函数 都 用 到 gen_server:cast/2, 因 此 handle_cast/2 回 调 也 需要 增加 两 个 相应 
的 子 句 来 实现 服务 全 端的 功能 。 首 先是 add_target_resource_type: 


handle cast({add target resource type, Typel}, State) -> 
TargetTypes = Statetstate.target resource types, 
NewTlTargetTypes = [Type | lijsts:delete(Type, TargetTypes)|], 
{noreply, Statet#tstate{target resource types = NewTargetTypes}}: 
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首先 ， 从 服务 需 状 态 中 提取 当前 所 有 目标 资源 的 类 型 。 然 后 ， 将 接收 到 的 资源 类 型 加 入 当前 
的 列表 。 为 了 避免 重复 ,对 执 行 一 次 删除 操作 。( 如 条 列表 中 不 包含 竺 删除 元 素 , 1ists:aqeletey/2 
为 数 不 会 对 列表 产生 影响 。) 

adqddq_ local resource 的 实现 类 似 : 


handje cast{{add local resource, {Type, Instance}}, State) 一 > 
ResourceTuples = Statetstate.local_ resource tuples, 
NewResourceTuples = add resource{({Type, Instance, ResourceTuplesl}, 


{noreply, Stateti#tstate{local_ resource tuples = NewResourceTuples}}: 
完 提 取出 所 有 本 地 资源 , 再 将 新 的 资源 实例 存放 至 指定 类 目下 。 这些 操作 由 模块 内 的 工具 也 
数 aqd_resourcec/3 完 成 ， 该 限 数 的 实现 如 下 : 


add resource (Type, Resource, ResourceTuples}) 一 > 
Case dict:find{Type, ResourceTuples) of 








{ok, ResourceList} -> 
NewList = [Resource | lists:delete{({Resource, ResourceList)], 
dict:store(Type, NewList, ResourceTuples):; 











error 一 > 
dict:store(Type, [Resource], ResourceTuples) 
end 


照例 内 部 函数 应 该 放置 在 模块 的 末尾 。 此 处 我 们 用 标准 库 中 的 dict 借 块 来 维护 资源 类 型 与 相 
应 的 资源 实例 列表 之 间 的 映射 关系 (这样 一 个 类 型 就 可 以 对 应 于 多 个 资源 实例 )， 如 图 8-7 
所 示 。 





资源 类 型 字典 





了 已 知 的 资源 实例 
[ x@a, x@b, ... ] 


| 
ee。 
和 
图 8-7 维护 资源 类 型 与 已 知 资源 实例 列表 间 映 射 关系 的 字典 ( 关联 数组 ) 


如 果 键 所 对 应 的 条 目 已 经 存在 ,就 读 出 当前 的 值 ， 在 列表 中 追加 资源 后 再 写 回 ; 为 了 保证 列 
表 中 资源 的 唯一 性 , 事先 也 需要 做 一 次 删除 。 如 果 对 应 的 条 目 不 存 在 ， 则 新 建 一 张 仅 包含 单个 资 
源 实例 的 列表 。 

3. 获取 和 交换 信息 

下 一 个 API 是 fetch _resources/1.: 














fetch resources (TYyPe) 一 > 
Ggen server:call (?SERVER, {fetch resources, Typel}). 


该 限 数 发 起 了 一 个 同步 调用 ,用 于 搜寻 与 某 给 定 资源 类 型 相符 的 所 有 资源 实例 。 为 了 实现 这 个 功 
能 ， 你 需要 给 handle_call/3 回 调 添 加 一 个 对 应 的 子 句 : 




















图 灵 社 区 会 员 for(;)(13433955876@163.com) 专 享 尊重 版 权 


180 第 8 齐 分布 式 Erlang/OTP 简 公 


handle calli{fetch resources, Type}, _From, State) 一 > 
{reply, dict:finad(Type, State#state.found resource tuples)}, State}: 


此 处 的 qict:fing/2 用 于 在 当前 的 资源 中 查找 Type。 其 结果 要 么 是 {ok,Value} 要 么 是 
error, 刚好 可 以 用 作 fetch_ resources/1 的 返回 值 ， 因此 无 须 任何 修饰 直接 将 结果 回 传 
就 好 。 

最 麻烦 的 工作 由 最 后 一 个 API 函 数 完成 : 


trade resources!{(}) 一 > 




















den server:cast (?SERVER, trade resources)}. 
这 个 API 函 数 通 过 一 个 简单 的 异步 调用 触发 整个 资源 交换 过 程 : 该 图 数 发 送 的 原子 
trade_resources 将 由 下 面 的 nandle_cast/2 子 句 处 理 。 该 子 句 和 下 一 个 子 句 中 的 代码 共同 驱 
动 了 图 8-6 中 的 通信 过 程 : 





handle castitrade resources, State) 一 > 
ResourceTuples = Stateitstate.local_ resource tuples, 
AllNodes = [node() | nodes()], 
lists: foreachl 
fun (Node} -> 
gen_ server:cast ({?SERVER, Node}, 
{trade resources, {node()}, ResourceTuples}},) 
end, 
AllNodes), 


(horedly, Statey; 

这 条 trade_resources 消 息 会 促使 本 地 节点 上 的 资源 探测 服务 紫 异 步 地 癌 Erlang 集 群 内 所 
有 互联 节点 上 的 资源 探测 服务 问 发 起 广播 (也 包括 本 地 市 点 上 自身, 这 种 对 称 性 使 你 无 须 额外 的 代 
码 便 可 以 更 新 本 地 的 资源 匹配 情况 。 ) 由 于 所 有 服务 需 进 程 在 各 自 节 点 上 都 采用 相同 的 注册 名 ， 
广播 的 实现 得 以 大 大 人 简化 。 

















在 服务 器 之 间 使 用 cast 

上 述 代 码 展 示 了 两 个 不 同 的 gen server 进程 如 何 用 gen server:cast/2 进行 通信 。 
由 于 是 异步 通信 ， 消 息 投递 完成 后 双方 都 会 立即 继续 埋头 处 理 手头 的 工作 。 一 般 情 况 下 ， 不 
要 用 同步 的 gen server:call/3 来 完成 这 类 任务 , gen server:call/3 会 阻塞 服务 器 直 
至 远程 服务 器 给 出 应 答 如 果 远 程 服务 器 刚好 也 正 忙 着 调用 你 这 边 的 服务 器 ， 双 方 就 会 陷 
入 死 锁 。 





这 些 广播 消息 的 格式 为 { trade resources, {ReplyTo, Resources}}, 其 中 ReplyTo 
是 发 送 方 所 处 市 点 的 节点 名 ( 由 node () 给 出 )，Resources 是 一 个 数据 结构 (一 个 gict )， 内 合 
发 送 方 打算 公布 的 所 有 资源 元 组 。Erlang 采 用 的 是 严格 的 复制 式 消息 传递 ， 因 此 你 不 用 担心 收 到 
消息 的 进程 搞 乱 你 的 本 地 数据 结构 。 同 时 由 于 Erlang 人 允许 你 在 消息 中 发 送 任意 数据 一 一 无 须 序 列 
化 一 一 你 可 以 耳 接 把 整个 字典 者 到 消 居中 去 。 

收 到 这 些 广播 消息 后 ， 节 点 将 调用 以 下 的 handle_cast/2 子 句 : 
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handje cast{({trade resources, {ReplyIlo, Remotes}}, 





#state{local_resource tuples = Locals, 
target resource types = TargetTypes, 挑选 出 所 需 的 
tound resource tuples = OldFound} = State) -> 资源 
FilteredRemotes = resources for types (TargetTypes, Remotes), 
NewFound = add resources (FilteredRemotes, OldFound), Wi 
将 之 纳入 已 知 


case ReplyTo of 
noreply -> 


资源 列表 


ok,; . 
回复 发 送 方 
Jen server:cast({?SERVER, ReplyTo}, < 二 一 
{trade_ resources, {noreply, Locals}}) 
end, 
{noreply, State#state{found resource tuples = NewFound}}. 





自 完 , 你 需要 从 当前 的 进程 状态 中 提取 出 大 干 字 上段, 这 可 以 由 子 名 首部 的 那 段 略 显 星 深 的 模 
式 来 完成 。 请 注意 这 个 形 如 #state{...}=State 的 模式 ， 这 是 一 个 别名 模式 : 借助 它 你 可 以 同 
时 完成 模式 匹配 和 赋值 。 在 阅读 代码 时 , 为 了 让 注音 力 集中 到 数据 的 形态 上 ,我 们 一 般 把 变量 名 
瑟 在 等 号 的 右 侧 ,但 写成 state=#statef{...} 也 是 可 以 的 。 

接着 , 就 是 检查 有 没有 谁 给 你 发 来 了 你 所 需要 的 资源 。 与 所 需 类 型 相符 的 那些 资源 随后 会 被 
添 加 至 本 地 的 已 知 资源 列表 中 。 最 后 , 青 给 发 送 方 一 个 应 党 就 行 了 (发 送 方 资源 探测 进程 所 处 的 
广 态 由 ReplyTo 标 识 )。 应 答 消 息 与 广播 消息 的 形态 相同 ， 只 是 将 发 送 方 节 点 特 换 成 了 原子 
noreply, 以 此 表明 该 消息 无 须 应 党 一 一 否则 这 些 消 居 将 会 在 服务 从 之 间 反 反复 复 地 永远 振 渐 下 
去 。 当 最 初 发 起 广播 的 进程 接收 并 处 理 完 所 有 应 答 之 后 , 它 所 持 有 的 资源 信息 就 与 其 他 节点 保持 
人 

以 下 是 在 前 面 用 到 过 的 几 个 内 部 工具 因数 。 第 一 个 函数 只 是 傈 单 地 循环 调用 前 面 定义 的 
addq_resource/2 困 数 ,从 而 一 次 性 添加 多 个 资源 元 组 。 第 二 个 果 数 要 更 复杂 一 些 , 它 (通过 1ists : 
f0191/3 ) 遍历 传人 的 资源 类 型 列表 ， 为 给 定 的 每 个 类 型 构造 了 一 张 完 整 的 已 知 资源 的 列表 : 















































adqd resources{([{Type, Resource} |T], ResourceTuples) 一 > 

adqd resourcestT, add resource(Type, Resource, ResourceTuples))}; 
add resources({[], ResourceTuples}) -> 

ResourceTuples. 
resources for types (Types, ResourceTuples) 一 > 

Fun = 


fun{({Type, ACC) 一 > 
case dict:find(Type, ResourceTuples}) of 
{okKk, List} -> 


[{Type, Instance} || Instance <- List] ++ Acc; < 一 
error 一 > 创建 一 张 
Acc 二 元 组 列 
engd | . 
end, 
lists:foldl{(Fun, [], Types). 





这 段 代 码 会 找 出 与 传人 的 每 个 资源 类 型 相对 应 的 资源 列表 , 给 其 中 的 每 个 资源 实例 配 上 对 应 
的 资源 类 型 ,再 将 它们 拼接 成 一 个 二 元 组 列表 ( 其 中 用 到 了 列表 速 构 ， 参 见 2.9 市 )。 接 着 ,该 列 
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表 叉 被 合 并 入 结果 列表 ( 即 Acc )。 (请 注意 ， 昌 然 这 些 列 表 不 会 太 长 ， 但 为 了 避免 平方 复杂 度 ， 
此 处 仍然 选择 从 左 侧 开始 构造 列表 ， 原 因 参 见 2.2.5 市 。) 该 函数 的 最 终结 果 随 后 将 被 用 作 
add resources/2 的 参数 。 

4. 结语 

一 旦 想 明 日 ,你 就 会 发 现 这 个 算法 还 是 相当 和 直截了当 的 。 即 便 做 出 了 一 些 价 化 , 它 仍 然 可 以 
满足 大 部 分 资源 探测 方面 的 需求 。 目前 主要 的 欠缺 在 于 我 们 无 法 目 动 触发 资源 探测 。 如 果 能 在 系 
统 中 的 某 些 关 键 位 置 上 加 上 相关 逻辑 ( 例如 将 之 融入 监督 结构 )， 我 们 就 不 用 手工 调用 
trade resources/0 | 。 这 个 问题 将 在 下 -前 得 到 解决 。 

这 是 一 大 市 点 间 的 点 对 点 协议 , 它 仅 依 赖 于 异步 消息 ,而 且 并 不 严格 依赖 于 集群 中 所 有 其 他 
方太 的 应 答 ， 因 此 整个 系统 的 容错 性 相当 好 。 可 能 发 生 的 最 坏 情况 就 是 扩 点 因 朋 沉 、 重 局 或 网 络 
故障 而 突然 消失 ,从 而 导致 其 他 方 点 上 的 信息 失真 (你 还 没有 加 入 自动 清理 消失 市 点 上 的 资源 的 
机 制 )。 

有 一 个 简单 的 集群 稳定 性 改进 方案 , 就 是 设立 一 个 进程 , 周期 性 地 试探 目 所 触及 的 所 有 节点 
并 触发 资源 交易 ， 以 此 来 克服 偶发 的 联络 中 断 问题 或 是 可 能 导致 世 点 间 连 接 中 断 的 掩 省。 我们 将 
该 方案 留 给 你 作为 练习 。 做 到 这 一 步 之 后 , 集群 的 健康 度 就 相当 有 保障 了 。 在 以 资源 探测 为 基础 
设计 系统 时 ， 你 必须 明确 目 己 能 从 中 获得 哪些 保障 。 在 上 述 方案 中 , 这 主要 取决 于 你 对 网 络 故 障 
恢复 时 长 的 预期 以 及 市 点 间 目 动 重 连 的 频率 。 

使 用 本 章 早 先 介绍 的 Erlang 分 布 式 编程 技术 ， 你 构建 了 一 套 系 统 ， 其 中 的 程序 能 够 目 行 探测 
其 他 服务 。 如 此 一 来 就 没 必 要 硬 编 码 集群 内 的 网 络 拓扑 和 服务 位 置信 息 了 。 不 到 100 行 的 代码 ， 
理 你 禹 开 了 一 鹿 门 ,构建 高 度 动 态 、 易 于 伸缩 的 服务 从 此 不 再 神秘 。 在 下 一 音 ,， 这 些 代码 就 要 投 
入 实战 了 。 


















































8.4 ”小 结 


我 们 在 本 草 介绍 了 Erlang 分 布 式 编程 中 的 多 个 重要 主题 : 

口 位 置 透明 性 和 复制 式 通信 ; 

口 Erlang 方 点 与 集群 ; 

口 基于 cookie 的 访问 控制 ; 

口 远程 shell 的 使 用 ; 

口 分 布 式 技术 综合 运用 : 简单 资源 探测 系统 的 实现 。 

你 在 本 章 所 学 的 内 容 将 给 你 的 编程 生涯 带 来 无 限 多 的 可 能 性 ,我 们 真心 希望 本 章 中 的 这 些 短 
小 精干 的 Erlang 分 布 式 编程 实例 能 够 激发 你 非凡 的 创造 力 。 

在 下 一 章 中 , 你 将 把 你 所 学 到 的 知识 一 一 以 及 你 所 写 的 代码 一 一 用 到 Simple Cache 应 用 中 去 ， 
把 它 从 单机 服务 改造 成 缓存 集群 , 进而 演变 为 一 套 会 话 存 储 服 务 , 以 便 帮 助 Erlware 的 同仁 为 用 户 
提供 更 棒 的 体验 。 
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用 Mnesia 为 cache 增 加 
分 布 式 文 持 


本 章 概要 

口 缓存 分 布 式 策略 的 选取 

口 Erlang 内 置 数据 库 Mnesia 人 简介 

口 利用 Mnesia 将 缓存 分 布 至 多 个 布点 





在 第 7 章 中 ， 你 的 绥 存 应 用 已 然 运 转自 如 ， 第 8 章 又 把 你 们 入 了 分 布 式 Erlang 的 世界 。 你 马上 
就 得 现 学 现 卖 咯 。Erlware 团 队 正 打算 给 站 点 增加 登录 和 会 话 功 能 : 有 了 它 , 软件 包 的 作者 将 可 以 
进行 多 种 软件 包 管 理工 作 , 包括 版 本 更 新 、 文 档 修订 、 软 件 成 束 度 标注 等 。 你 的 任务 就 是 进一步 
扩展 缓存 应 用 的 功能 ， 使 之 能 够 为 该 需求 中 的 会 话 状 态 存 储 功 能 提供 文 持 。 

Erlware 站 点 的 最 前 病 涤 设 了 一 套 无 状态 的 负载 均衡 系统 ,因此 页 面 加 载 请 求 可 能 会 沙 到 任意 
一 人 台 可 用 的 Web 服 务 胡 上 。 也 就 是 说 该 Web 应 用 中 的 所 有 服务 带 神 要 能 够 访问 会 话 状 态 信 息 才 
行 。 问 题 在 于 ， 按 照 当 前 的 设计 ， 每 个 Web 服 务 带 郡 只 能 访问 运行 在 本 地 的 缓存 ， 而 且 各 个 组 
存 实 例 对 运行 在 其 他 Web 服 务 角 上 的 缓存 实例 的 状况 也 一 无 所 知 。 当 前 架构 的 简化 视图 如 图 9-1 
所 未 。 






















软件 包 服 
务 右 集群 


图 9-1 缓存 应 用 当前 的 简单 架构 。 每 个 Web 服 务 句 只 能 访问 运行 在 本 地 的 缓存 。 受 负 
载 均衡 的 影响 , 请 求 会 被 派发 至 各 个 服务 姑 , 要 想 在 缓存 中 存储 会 话 状态 数据 ， 
就 必须 实现 分 布 式 缓 存 
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现 阶段 就 把 会 话 状 态 信 息 存 人 缓存 的 话 , 受 负载 均衡 的 影响 , 用 户 从 一 全 Web 服 务 冀 登录 后 ， 
下 一 个 页 面 请 求 很 有 可 能 会 落 到 万 一 台 Web 服 务 厅 上 。 由 于 本 地 缓存 中 没有 对 应 的 会 话 状 态 ， 后 
一 台 服 务 具 将 无 法 识别 用 户 。 要 是 缓存 实例 之 间 的 信息 可 以 共 圣 ， 那 束 万 事 大 吉 了 。 


9.1 分 布 式 缓存 


现在 Erlware 团 队 委托 你 来 升级 他 们 的 缓存 , 以 便 在 其 中 保存 会 话 状态 数据 。 升 级 后 要 求 能 够 
从 任意 一 个 缓存 服务 实例 上 读 出 与 指定 的 会 话 密 钥 对 应 的 会 话 状态 ; 无 论 指 定 的 是 哪个 密 钥 , 也 
无 论 数据 存放 在 何 处 ， 都 要 能 读 出 来 。 像 原先 那样 仅 存储 本 地 Web 服 务 器 上 的 数据 肯定 是 不 够 用 
了 , 你 需要 的 是 一 套 能 打通 系统 中 的 每 个 实例 的 分 布 式 缓存 。 为 此 ， 必须 先 想 清楚 各 实例 间 的 信 
息 交 换 方式 。 




















9.1.1 选取 通信 案 略 


在 设计 分 布 式 程序 时 ， 可 供 选 择 的 通信 方式 主要 有 两 种 : 异步 通信 和 同步 通信 。 在 1.1.3 节 中 
我 们 曾 对 此 做 过 简要 讨论 。 采 用 异步 通信 时 ,发 送 方 无 须 等 符 任 何 确认 或 应 答 。 而 在 采用 同步 通 
信 时 , 发 送 方 会 处 于 挂 起 状态 , 直至 收 到 回复 为 止 ( 即便 只 是 “ 收 到 , 多 谢 ” 之 类 的 确认 性 回复 )。 
Erlang 消 息 传 递 的 基本 形式 就 是 异步 的 ， 因 为 这 种 形式 最 为 简单 灵活 : 一 般 来 说 异步 通信 更 适合 
分 布 式 编程 ,而 且 同 步 通信 总 可 以 利用 成 对 的 异步 请 求 / 啊 应 消息 来 模拟 ( gen_server :cal173 
就 是 这 样 做 的 )。 

通信 形式 以 异步 为 主 ,并 不 是 说 在 构造 程序 时 就 不 能 采用 别 的 范式 。 在 这 一 市 中 , 我们 将 针 
对 通信 策略 的 选取 展开 讨论 , 看 看 不 同 的 通信 策略 会 造就 出 怎样 的 系统 ,这些 系统 又 分 别 会 具备 
哪些 属性 。 

1. 异步 通信 

异步 通信 有 时 也 被 称 为 “ 即 发 即 忘 ”( fire and forget ) “ 式 或 “ 即 发 即 盼 ”( send and pray ) 式 
通信 。 消 息 一 上 路 ， 发 送 方便 撒手 不 管 ， 继 续 干 活 。 如 果 预 期 远 端 进程 应 该 给 出 应 答 ， 发 送 方 随 
后 会 伺机 检查 应 答 消 息 ， 如 图 9-2 所 示 。 一 般 来 说 ， 能 和 否 在 指定 时 间 内 收 到 应 答 并 不 影响 发 送 方 
后 续 的 工作 ， 至 少 部 分 工作 不 会 受到 影响 。 

异步 通信 的 开销 很 低 ， 是 计算 机 系统 间 一 种 良好 的 基本 通信 形式 。 由 于 省 去 了 各 种 检查 、 扫 
描 、 验 证 、 计 时 等 杂 务 ,异步 通信 非常 之 快 , 尤其 适用 于 创建 简单 而 直观 的 系统 。 我 们 的 建议 是 ， 
除非 万 不 得 已 ， 否 则 请 尽量 采用 异步 通信 。 

为 了 举例 说 明 异 步 通信 策略 的 适用 场景 , 我 们 不 妨 与 邮政 业务 作 一 个 类 比 。 壁 如 你 正 打算 给 
祖母 写 信 。 写 好 信 ， 把 信和 塞 和 人 信封 贴 上 邮票 ， 最 后 丢 进 邮 人 简 。 好 了 了， 人 处理 完毕 ,接着 写 第 二 封 
信 去 吧 。 一 般 情 况 下 信和 都 可 以 寄 到 ， 当 然 也 不 一 定 ; 但 无 论 如 何 ， 它 都 不 会 妨碍 你 寄 信 当天 的 后 
续 活 动 。 这 种 方式 具有 其 固有 的 优点 。 信 可 能 会 寄 委 ,也 可 能 过 了 很 久 才 送 到 ,祖母 读 完 后 也 有 
















































































GD fire and forget 原 本 用 于 形容 发 射 后 可 自动 制导 、 无 顷 人 工 干 预 的 武器 系统 。 
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可 能 会 一 直 扭 到 下 个 月 才 回 信 。 不 管 怎么 样 , 你 在 整个 过 程 中 是 自由 的 , 无 须 坐 等 结果 。 换言之 ， 
这 套 系统 能 够 从 容 面 对 意 外 事件 ,只 要 系统 中 的 各 个 角色 能 够 正确 处 理 这 些 意外 , 整个 系统 便 可 
以 持续 运作 。 





A 给 B 发 送 了 一 条 消息 然后 B 接 收 消 息 后 


米 结 2 
en 继续 运行 








图 9-2” 即 发 即 志 的 异步 通信 : 消息 一 发 完 ， 发 送 方便 撒手 不 管 ， 继 续 干 活 。 应 答 消息 
将 被 单独 发 回 


2. 同步 通信 

在 同步 通信 中 ， 每 条 消息 都 需要 一 个 应 答 ( 哪怕 只 是 一 条 用 于 确认 消息 送 达 的 回执 )。 在 收 
到 应 答 之 前 发 送 方 会 被 挂 起 ,什么 也 做 不 了 。 由 于 发 送 方 在 等 竺 应答 的 过 程 中 处 于 阻塞 状态 ,这 
种 通信 策略 又 被 称 做 阻塞 式 通信 。 上 典型 的 同步 信息 交换 过 程 如 图 9-3 所 示 。 





A 给 B 发 送 了 一 条 请 且 


ee B 收 到 销 息 后 进行 处 理 ， 
并 等 待 响 应 收 到 消息 后 进行 


然后 给 A 一 个 应 管 





A 在 收 到 应 答 后 继续 执行 


图 9-3 ”同步 阻塞 式 通信 : 在 收 到 应 答 之 前 ， 发 送 方 会 被 挂 起 。 即 使 发 送 方 的 后 续 工 作 
并 不 严格 依赖 于 该 应 答 ， 也 会 被 过 中断， 中 断 时 长 不 短 于 消息 往返 一 个 来 回 所 
需 的 时 间 


同步 通信 和 最 显著 的 缺陷 就 是 在 收 到 啊 应 之 前 发 送 方 什么 者 做 不 了 (在 分 布 式 环境 下 , 这 上 段 时 
间 至 少 是 网 络 中 两 合计 算 机 之 间 消 息 传 递 时 延 的 两 倍 )。 丸 一 方面 ， 它 的 优势 也 很 明显 ， 那 就 是 
可 以 轻易 地 让 系统 在 某 一 活动 中 保持 同步 。 

比方 说 , 一 个 生意 人 火 急 火 煤 地 回 进 政府 办 公 室 来 给 他 的 车 交 昼 单 。 如 来 不 结 清 罚 浆 , 再 被 
发 现 违章 停车 的 话 他 的 车 可 就 要 被 拖 走 了 。 他 来 到 柜台 前 , 递 上 一 张 文 票 ， 请 办 事 员 清 空 他 的 违 
曹 记录。 和 前 面 寄 信 的 例子 不 同 ， 这 位 老兄 还 不 能 走 一 一 他 还 没完 事 儿 。 他 得 在 办 公 室 里 等 着 ， 
百 到 柜 侣 办事员 处 理 完 他 的 蜀 蒜 ,告诉 他 违章 记录 已 经 清空 为 止 。 等 他 拿 到 收据 ， 确 认 系 统 已 经 
进入 预想 状态 ， 他 才能 离开 办 公 室 赶 回 去 工作 。 
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在 实际 应 用 中 , 同步 通信 需要 与 超时 配合 使 用 。 政府 交通 管理 办 公 室 的 那 位 老兄 不 会 一 直 从 
等 到 渴 死 为 止 , 他 会 有 一 个 最 长 等 待 时 间 的 心理 预期 一 -一段 时 间 之 后 ， 他 必须 放弃 等 待 ， 要 么 
认定 缴 款 失 败 ,要 么 磁 磁 运气 假设 缴 款 成 功 。 如 果 他 认为 再 等 下 去 也 是 浪费 时 间 ( 比如 收据 还 没 
拿 到 ， 办事员 又 不 在 ,而 且 看 上 去 一 整 天 都 回 不 来 ) 那么 他 可 以 先 回去 ， 择 日 再 来 ， 或 者 想 想 
别 的 办 法 来 解决 问题 。 图 9-4 展 示 的 就 是 带 超时 的 同步 调用 。 


2 秒 
每 10 秒 
?种 


图 9-4” 带 超 时 的 同步 通信 。 最 长 等 待 时 间 是 10 秒 ， 整 个 信息 交换 过 程 耗 时 8 秒 : 
消息 发 送 耗 时 2 秒 ， 请 求 处 理 耗 时 4 秒 ， 结 果 返 回 耗 时 2 秒 


前 面 两 段 有 点 儿 跑 题 ， 主 要 是 为 了 让 你 想 清 芭 目 己 将 要 设计 的 缓存 是 一 套 怎 样 的 系统 : 需 不 
需要 在 茶 些 时 机 同步 茶 些 特 定 的 状态 ? 回 系 统 中 搬入 或 从 系统 中 删除 一 段 数据 后 , 是 否 所 有 缓存 
实例 都 必须 在 第 一 时 间 反 映 最 新 的 状态 ? 也 许 你 的 系统 并 不 需要 如 此 严格 的 同步 。 或 许 它 可 以 更 
异步 一 些 ， 以 删除 操作 为 例 , 没有 必要 先 汇 总 所 有 市 后 的 执行 结 来 再 返回 。 这 些 设计 决策 对 你 的 
编码 方案 有 春 决定 性 的 影响 。 在 给 缓存 湛 加 分 布 式 文 持 之 前 ， 应 该 仔细 考察 一 下 各 种 可 选 方案 ， 
看 看 它们 会 对 结果 产生 怎样 的 影响 。 


















































9.1.2 同步 缓存 和 异步 缓存 


如 前 文 所 述 , 两 种 途径 各 有 利兹 。 然而 软件 开发 中 的 各 种 决策 何尝 不 是 如 此 。 在 这 个 案例 中 ， 
选用 同步 方案 还 是 异步 方案 必 将 对 你 的 分 布 式 绥 存 实现 产生 至 关 重 要 的 有 影响。 

1. 异步 缓存 

假设 某 人 在 站 点 上 完成 了 登录 , 间隔 一 秒 之 后 又 针对 另 一 个 页 面 发 起 了 请 求 , 却 被 告知 自己 
根本 没有 在 该 站 点 上 登录 过 。 要 是 可 以 容忍 这 种 状况 , 那么 缓存 的 插入 操作 就 可 以 采用 非 阻塞 通 
信 来 实现 别 误会 ,不 保证 插入 操作 完成 时 系统 状态 的 一 致 性 并 不 意味 着 插入 操作 会 频繁 出 错 或 
是 执行 速度 很 慢 一 一 只 是 无 法 得 到 百分之百 的 一 致 性 保障 罢了 。 总 体 来 看 ,服务 的 整体 状态 有 可 
能 会 出 现 临时 的 不 一 致 ， 而 且 在 某 个 较 低 的 概 靳 下 用 户 有 可 能 会 感知 到 这 种 不 一 致 。 

Erlang 特 别 擅长 实现 基于 异步 消息 的 设计 。 在 上 一 章 中 我 们 了 解 到 Erlang 节 点 可 以 组 成 集群 。 
只 要 把 所 有 缓存 都 纳入 同一 个 集群 ， 异 步 系 统 的 设计 就 可 以 大 大 简化 。 第 8 草 中 的 资源 探测 示例 
表明 , 在 集群 条 件 下 可 以 很 容易 地 回 所 有 缓存 实 例 发 送 广播 。 集 群 中 的 任意 一 个 缓存 实例 在 执行 
插入 、 删 除 操作 时 都 可 以 向 整个 集群 发 起 广播 。 

考虑 以 下 登录 事件 序列 : 

(1) 用 户 登 录 网 站 ; 

(2) Web 服 务 希 创建 会 话 ; 

(3) Web 服 务 大 调用 simple_cache:insert (); 
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(4) 执行 插入 操作 的 子 数 回 所 有 已 知 市 点 异步 发 送 一 条 插入 消息 然后 立即 返回 ; 

(5) Web 服 务 硕 告知 用 户 登 录 成 功 ; 

(6) 位 于 其 他 服务 融 上 的 绥 存 实例 收 到 搬入 消息 并 进行 处 理 。 

该 通信 模式 如 图 9-5 所 示 。 采 用 这 种 策略 实现 的 缓存 只 能 提供 弱 一 致 性 保障 : 即便 客户 端 已 
经 被 告知 登录 完成 ， 服 务 右 却 并 不 能 保证 每 个 缓存 方 点 都 已 经 收 到 登录 消 且 并 完成 了 处 理 。 


远程 
缓存 

















图 9-5 ”异步 缓存 的 交互 过 程 : 在 执行 写 操 作 时 ， 相 应 的 函数 会 回 所 有 绥 存 实例 发 送 消 
上 县， 消息 一 经 发 送 ， 困 数 便 会 立即 返回 至 调用 方 并 告知 操作 完成 ， 然 而 此 时 远 
程 的 缓存 可 能 还 没 来 得 及 收 到 消息 并 完成 更 新 

简单 得 不 能 再 简单 了 吧 。 假 设 缓存 之 间 的 通信 和 能够 抢 在 用 户 的 下 一 次 页 面 请 求 之 前 完成 , 那 
么 一 切 天 衣 无 颖 。 这 个 方案 最 大 的 优势 就 在 于 系统 的 运作 方式 简单 耳 接 ( 大 违 至 简 ， 人 简单 总 是 好 
事 )， 用 不 了 几 行 代码 便 可 以 实现 。 

不 等 的 是 ,对 于 用 户 刚 刚 完 成 登录 却 又 被 告知 “ 疝 未 登录 ”的 情况 ，Erlware 的 负责 人 持 零 容 
仍 态 度 一 一 哪 介 这 种 情况 只 是 在 系统 负载 高 得 离谱 时 才 会 出 现 。 没 办 法 ， 只 能 另 寻 出 路 了 。 

2. 同步 缓存 

要 想 在 所 有 绥 存 实例 和 都 收 到 消息 并 如 期 插入 数据 之 后 再 告知 用 户 登 录 成 功 , 则 事件 序列 应 调 
整 如 下 : 

(1) 用 户 登 录 网 站 ; 

(2) Web 服 务 侣 创建 会 话 ; 

(3) Web 服 务 表 调用 simple_cache:insert (); 

(4) 执行 插入 操作 的 函数 阻塞 ， 直 至 所 有 缓存 实例 完成 数据 插入 操作 : 

(5) Web 服 务 表 告知 用 户 登 录 成 功 。 

该 通信 模式 如 图 9-6 所 示 。 

同步 模式 提供 的 一 致 性 保障 与 异步 模式 有 所 不 同 。 在 这 种 模式 下 ,只 有 在 所 有 绥 存 实例 都 拿 
到 会 话 数 据 之 后 ,系统 才 会 告知 用 户 登 录 成 功 。 也 就 是 说 执行 插入 操作 的 函数 必须 先 收 到 所 有 绥 
存 实 例 的 确认 消息 才能 进行 下 一 步 动作 。 

这 个 模式 可 以 采用 好 几 种 不 同 的 手法 来 实现 。 第 一 种 就 是 照搬 上 述 描述 ， 用 gen_server:call/2 
逐个 加 各 节点 同步 发 送 插入 消息 ， 百 到 最 后 一 个 节点 更 新 完毕 后 才 返 回 。 然 而 当 你 有 N 个 远程 节 
点 时 ， 整 个 操作 的 耗 时 至 少 是 消息 在 网 络 上 往返 一 个 来 回 的 最 小 时 延 的 N 倍 。 这 种 程度 的 延 开 理 
应 极力 避免 。( 但 请 注意 ， 应 答 消 息 收 集 过 程 的 耗 时 ， 是 由 反应 速度 最 慢 的 缓存 实例 的 啊 应 时 间 






























































图 灵 社 区 会 员 for(;)(13433955876@163.com) 专 享 尊重 版 权 


188 第 9 草 用 Mnesia 为 cache 增加 分 布 式 支持 


决定 的 一 一 所 有 同步 方案 ， 无 论 怎么 实现 ， 都 无 法 线 开 这 个 限制 。) 











图 9-6 ”同步 缓存 的 交互 过 程 : 发 起 插 和 人 操作 的 缓存 前 器 会 一 二 阻塞 和 至 所 有 绥 存 实例 
都 完成 更 新 为 止 。 唯 有 那 时 Web 服 务 器 才 会 通知 用 户 登 录 成 功 


高 效 实 现 分 布 式 事务 的 另 一 途径 就 是 研读 诸如 两 阶段 提交 协议 等 内 容 。 但 那 也 未 免 又 太 小 题 
大 做 了 : 照 这 么 走 下 去 ,简直 就 是 在 开发 分 布 式 数据 库 。 如 果 那 就 是 你 的 目标 , 那么 也 许 你 应 该 
先 在 Erlang/OTP 库 找 一 找 ， 看 看 有 没有 现成 的 解决 方案 。 


9.1.3 ”分布 式 表 


回想 一 下 第 6 草 的 网 6-5， 绥 存 应 用 在 结构 上 由 奉 干 持 有 实际 存储 数据 的 存储 元 素 进 程 组 成 ， 
同时 还 有 一 张 表 , 记录 春 每 个 键 与 对 应 的 存储 元 素 进 程 标识 符 之 间 的 映射 天 系 。 需 要 在 各 缓存 实 
例 间 以 分 布 式 方式 存储 的 其 实 只 有 这 张 映射 表 而 已 。 由 于 Erlang 的 位 置 透明 性 ， 没 有 必要 在 节操 
间 复 制 数据 : 只 要 Web 服 务 胡 之 间 的 网 络 足够 高 效 ， 即 便 存 储 进程 位 于 为 一 台 服 务 各 上， 调用 远 
程 存储 进程 的 速度 也 要 远 快 于 调用 原始 的 软件 包 服 务 带 。 因此 , 只 要 所 有 市 点 都 能 访问 到 键 与 pid 
间 的 映射 关系 ,存储 元 素 进程 大 可 静 静 地 竺 在 创建 它们 的 服务 带 上 ， 免 受 迁 移 萎 顿 之 否 。 上 映射 关 
系 表 、 缓 存 实例 以 及 存储 元 系 进 程 之 间 的 关系 参见 图 9-7。 


缓存 1 缓存 2 












































存储 元 素 (进程 ) 

















图 9-7 ”两 个 缓存 实例 共享 一 张 文 持 元 余 复 制 的 映射 关系 表 ， 表 中 记录 着 键 与 进程 标识 符 
间 的 映射 天 系 。Erlang 的 位 置 透明 性 确保 我 们 无 须 关 心 进程 所 在 的 节点 ， 从 而 催 
化 了 进程 的 访问 方式 ;只 有 这 张 映射 表 需 要 在 节点 之 间 以 分 布 式 形式 进行 存储 


现在 来 看 ， 只 要 能 够 解决 映射 表 的 分 布 式 存 储 问 题 承 可 以 了 。 刚 巧 ，Erlang/OTP 为 这 个 问题 
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提供 了 绝 佳 的 解决 方案 : 一 套 名 为 Mnesia 的 分 布 式 数 据 库 , 看 上 去 恰恰 可 以 满足 需求 。 了 解 到 这 
些 信息 之 后 ， 你 带 着 设计 草案 去 找到 Erlware 的 家 伙 们 ， 他 们 很 满意 ， 放 手 去 干 吧 。( 不 管 做 什么 
都 得 甲 方 点 头 才 行 啊 ! ) 

为 了 进一步 完善 这 套 方案 , 你 还 需要 用 上 一 章 打造 的 资源 探测 系统 来 跟踪 缓存 节点 ,从 而 实 
现 节 点 的 动态 增删 。 听 起 来 工作 量 还 真 不 小 啊 。 赶 紧 开 始 吧 ， 首 先 来 讨论 一 下 Mnesia， 看 看 它 是 
如 何 工 作 的 。 


9.2 用 Mnesia 实现 分 布 式 数据 存储 


Mnesia 是 一 套 轻 量 级 的 软 实 时 分 布 式 数据 存储 系统 ， 文 持 见 余 复 制 和 事务 , 特别 适合 于 存储 
离散 的 Erlang 数 据 块 ， 尤 其 擅长 RAM 中 的 数据 存储 。Mnesia 天 生 文 持 Erlang，Erlang 数 据 无 须 任 
何 格式 转换 便 可 原封 不 动 地 存 人 其 中 。 有 鉴于 此 ， 它 目 然 就 成 为 了 缓存 应 用 首选 的 数据 库 方案 。 
不 过 在 正式 启用 Mnesia 之 前 ， 有 必要 先 了 解 一 下 Mnesia 自 号 的 一 些 局 限 。 

就 设计 目标 而 言 ，Mnesia 从 来 就 没有 打算 取代 SQL 型 数据 库 ， 也 不 应 该 用 于 管理 分 布 于 数 十 
台 机 和 右上 的 数 百 吉 比 特 的 持久 化 数据 。 这 种 案例 倒 也 不 是 没有 ,但 我 们 并 不 推荐 这 种 用 法 。Mnesia 
更 适用 于 元 余数 较 低 、 尺 才 较 小 的 数据 存储 需求 。 对 于 大 小 适中 的 〈 基 于 磁盘 的 ) 持久 化 数据 ， 
或 是 需要 跟 进 程 共 至 的 运行 时 数据 ，Mnesia 都 是 不 错 的 选择 。 要 是 出 于 容错 和 性 能 考虑 ， 还 需要 
将 数据 分 布 至 多 个 节点 ， 那 Mnesia 束 更 为 擅长 了 。 我 们 正 打 算 解 决 的 键 二 pid 辣 映射 关系 数据 的 
存储 问题 便 是 该 应 用 场景 的 一 个 绝 佳 范例 。 


















































Mnesia 这 个 名 字 的 由 来 

Mnesia 数据 库 刚刚 诞生 的 时 候 , 项 目的 研发 负责 人 以 其 独特 的 幽默 感 给 它 取 名 为 Amnesia 
(失忆 症 )。 然 而 很 快 管理 层 便 通 知 他 爱立信 的 产品 线 中 绝 不 能 容 尺 一 个 名 为 失忆 症 的 数据 库 。 
于 是 这 位 负责 人 便 淹 挤 了 那个 不 讨好 的 A， 剩 下 的 就 是 Mnesia 了 。 这 个 名 字 还 不 赖 : 在 希腊 


语 中 mnesia 就 是 “记忆 ”的 意思 。 了 


帘 然 之 间 就 引入 了 一 套 文 持 容 错 和 宛 余 复制 功能 的 数据 存储 系统 ， 你 可 能 还 有 点 儿 无 所 适 
从 。 不 过 没关系 ， 实 践 出 真知 ， 你 将 在 这 一 市 建立 一 套 切 实 可 用 的 Mnesia 数 据 库 。 在 此 过 程 中 ， 
你 将 充分 掌握 相关 的 基础 知识 ， 并 在 后 续 的 9.3 节 中 将 之 应 用 到 缓存 应 用 中 去 。 








9.2.1 建立 项 目 数据 库 


现在 正式 开始 学 习 Mnesia。 首 先 要 建立 一 个 数据 库 ,用 于 存储 Erlware 软 件 包 仓库 的 项 目 信 息 。 
当前 这 一 版 本 的 数据 库 只 处 理 基 本 数据 ， 用 于 存放 用 户 信息 以 及 用 户 所 参与 的 项 目的 信息 。 这 
些 信 息 将 被 分 别 放置 在 知 干 张 表 中 。 各 数据 间 的 关系 模型 参见 图 9-8。 可 以 看 到 ， 在 该 模型 中 














J) 也 许 是 因为 Erlang/OTP 和 Mnesia 都 出 自 瑞 典 ， 译 者 一 直 没 有 找到 关于 mnesia 一 词 英文 发 音 的 官方 说 法 。 有 鉴于 
mnesia 源 自 amnesia( [zmmi:zjs] )， 不 妨 读 作 [mi:zjs]。 一 一 译 者 注 
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User( 用 户 ) 表 和 Project( 项目 ) 表 各 有 两 个 字段 ，Contributor (参与 人 ) 表 则 维护 着 这 两 张 表 


之 间 的 关系 。 





图 9-8 ”项目 数 据 库 的 数据 模型 。 通 过 连接 用 户 的 ID 和 用 户 所 参与 的 项 目的 名 称 
( Title ) ，Contributor 表 将 User 表 和 了 Project 表 关联 了 起 来 。 其 中 用 户 ID 和 项 目 名 
称 在 数据 库 中 都 是 唯一 的 
在 Mnesia 中 ， 表 项 可 由 普通 Erlang 记 录 定 义 。 代 码 清单 9-1 中 罗列 了 该 示例 中 用 到 的 所 有 
记录 。 
代码 清单 9-1 项 目 数据 库 的 记录 定义 


-record{(user, 1 














-record{project, { 
title, 
description 


ys 


-recorgd(contributor, f{ 
user 1Q, 
title 

}). 


过 一 会 儿 建 表 的 时 候 ， 这 些 记 录 定 义 就 会 派 上 用 场 。 但 此 前 还 有 一 些 准备 工作 要 做 。 建 立 数 
据 库 的 过 程 可 分 为 以 下 几 个 步骤 : 

口 初始 化 Mnesia; 

口 启动 市 点 ; 

口 建立 数据 库 模式 ( schema ); 

口 启动 Mnesia: 

口 建立 数据 库 表 ; 

口 回 新 建 的 表 中 录入 数据 ; 

口 对 数据 做 一 些 基 本 查询 。 

先 从 Mnesia 的 初始 化 开始 吧 。 
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9.2.2 初始 化 数据 库 


在 所 有 步 又 之 中 , 第 一 步 承 是 Mnesia 的 初始 化 。 该 过 程 主要 就 是 在 磁盘 上 写 人 一 些 基 本 信息 。 
首先 启动 一 个 Erlang 节 点 ， 在 局 动 时 需要 告诉 它 应 该 将 Mnesia 的 相关 信息 写 到 文件 系统 中 的 什么 
地 方 。 





























1. 启动 市 点 
在 使 用 Mnesia 时 ， 请 按 如 下 方式 启动 Erlang 节 点 : 
erl] -mnesia dir '"/tmp/mnesia storenr' -nanme mynode 











上 述 命 令 会 把 数据 的 存放 路 径 告 知 给 Mnesia。( 请 注意 ,命令 行 中 的 单 引 号 用 于 保留 字符 串 
两 端的 双 引 号 。) 同时 ， 该 命令 通过 -name 选 项 让 Erlang 以 分 布 式 模式 启动 以便 局 用 Mnesia 的 元 
余 复制 功能 。( 请 按 需 选 用 -sname 或 -name 选 项 。) 节点 局 动 之 后 ， 还 需要 在 即将 参与 元 余 复 制 
的 所 有 节点 上 建立 一 套 空 的 初始 数据 库 模 式 。 

2. 建立 数据 库 模式 

所 谓 数 据 库 模 式 ( schema ) “就 是 一 些 描 述 信息 ， 其 中 记录 着 当前 数据 库 中 存 有 哪些 表 ， 表 
的 详细 情况 又 如 何 , 一 般 来 说 不 用 关注 它 一 一 它 只 是 Mnesia 用 于 跟踪 自重 数据 的 一 种 手段 。 当然， 
要 想 在 多 个 市 点 上 建立 分 布 式 数 据 库 , 就 必须 在 所 有 市 点 上 存放 一 份 该 模式 的 副本 ,以 便 让 市 点 
了 解 自己 所 存 的 数据 的 一 般 结 构 。 为 了 防止 Mnesia 或 整个 Erlang 节 点 关闭 重启 时 丢失 数据 库 信 息 ， 
檬 式 数 据 必 须 保存 在 人 磁盘 上 ， 存放 路 径 由 市 点 启 动 命令 中 的 -mnesia dir "..." 选项 指定 。 (我 
们 也 可 以 让 单个 或 多 个 市 点 ， 其 至 所 有 市 点 仅 在 RAM 中 保存 包括 数据 库 模 式 在 内 的 所 有 数据 ; 
但 目前 我 们 需要 的 是 保存 在 磁盘 上 的 持久 化 数据 库 。) 

这 个 例子 比较 简单 ， 只 需要 在 本 地 有 点 上 建立 数据 库 模 式 即 可 : 


(mynodeQ@erlware.org})1> mnesia:create schemal( [node{(}]}. 


该 命令 用 于 在 本 地 市 点 上 建立 空 数据 库 模式 。 如 有 果 执 行 失 败 , 那么 有 可 能 是 因为 当前 节点 无 
法 与 列表 中 的 某 个 节点 建立 通信 , 也 可 能 是 某 个 节点 上 已 经 有 Mnesia 在 运行 , 亦 或 其 中 某 个 节点 上 
残留 有 旧 的 数据 库 模式 。( 对 于 最 后 一 种 情况 , 可 以 调用 mnesia:delete_schema (Nodes) 来 清理 
旧 有 模式 一 一 但 请 务必 三 思 而 后 行 : 这 样 做 会 令 当 前 数据 库 中 的 所 有 表 都 陷 人 万 支 不 复 的 境地 。) 

数据 库 模 式 就 绪 后 ， 就 可 以 司 动 Mnesia 应 用 了 。 

3. 启动 Mnesia 

调用 mnesia:start() 便 可 手动 启动 Mnesia。Mnesia 运 行 起 来 之 后 ， 可 以 调用 mnesia: 
info() 来 核实 数据 库 的 基本 信息 ， 如 数据 库 中 现存 多 少 张 表 ， 当 前 与 多 少 个 节点 相连 等 : 


(mynodeQ@erlware.org}2> mnesia:start!{}. 
Ok 
(mynodeaerlware.org}3> mnesia:1infolt{). 









































---> Processes holding locks <--- 











中 为 避免 与 “模式 匹配 ”的 “模式 ”( pattern ) 混 消 ， 本 书 将 schema 译 作 “ 数 据 库 模式 ”， 在 上 下 文 不 存在 混 消 的 情 
况 下 会 简称 为 “模式 ”。 一 一 译 者 注 
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———> Processes waiting for locks <-——-— 

-—--> Participant transactions <--- 

---> Coordinator transactions < 一 一 

---> Uncertaln transactions <--- 

-一 -> Active tables <-—- 

schema : With 1 records occupying 422 words of mem 
===> System info in version "4.4.8", debug level = none <=== 
opt_disc. Directory /tmp/mnesia'" is used. 

use fallback at restart = false 

running db nodes = [mynode@erlware.orgl] 

stopped db nodes = [|] 

master node tables = [|] 


remote = [【] 

ram copies = |[【] 

disc copies = [schemal] 

disc only copies 三 []] 

[ {mynodeG@erlware.org,disc copies}] = [schemal 


2 transactions committed, 0 aborted, 0 restarted, 0 logged to disc 
0 held locks, 0 in gueue; 0 local transactions, 0 remote 
0 transactions waits for other nodes: |[] 


Ok 
用 这 种 方法 可 以 很 方便 地 核实 线 上 系统 的 配置 , 例如 各 和 点 间 的 全 连通 状况 及 一 切 是 否 配置 
元 














现在 数据 库 系统 已 经 初始 化 完毕 ， 可 以 开始 编写 应 用 代码 了 ， 第 一 步 是 建 表 。 


9.2.3” 建 表 


建 表 操 作 完 全 可 以 直接 在 Erlang shell 中 进行 ,但 由 于 shell 对 记录 的 支持 很 有 和 限 ， 这 样 做 会 有 
点 几 别 扭 。 作 为 蔡 代 ， 我 们 还 是 打算 编写 一 个 小 模块 来 完成 这 项 工作 ， 参 见 代码 清单 9-2。 和 此 
前 一 样 , 为 了 市 约 篇 幅 我 们 上 略 去 了 源码 中 的 注释 一 一 在 实际 对 外 发 布 的 代码 中 可 不 能 这 样 。 人 简洁 
起 见 ， 我 们 复制 了 代码 清单 9-1 中 定义 的 记录 ; 通常 应 该 将 它们 放 入 单独 的 头 文 件 ， 然 后 让 模块 
包含 该 头 文件 。 


代码 清单 9-2 ”Mnesia 建 表 模 块 


-module (create tables). 











-export ([init tables/0]}. 


-record(user, { 
id, 
name 


}). 


-record (project, f{ 
七 工 七 荆 拓 ， 
description 


ls 


-record(contributor, { 
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user igd, 
project_ title 
Fg 


init tablegs() -> 
mnesia:create table (user, 
[ {attributes, recorgd info{fields, user})}]), 
mesia:create table(project, 
[{attributes, record_ info(fields, project})}]), 
mnesia:create table(contributor, 
[{type, bag}, {attributes, record infol(fielgds, contributor)}]1). 

可 以 看 到 ， 建 表 操 作 是 调用 图 数 mnesia:create_table(Name，Options) 完 成 的 ， 其 中 
options 是 一 张 {Name，Value} 选 项 列表 。 在 所 有 选项 之 中 ， 最 重要 的 一 个 就 是 attributes ， 
几乎 所 有 建 表 操 作 都 会 用 上 它 。 该 选项 用 于 指定 表 中 所 存 记 录 的 字段 名 。 要 是 没有 它 ，Mnesia 
会 假定 记录 中 仅 有 两 个 字段 ， 分 别名 为 kevy 和 val。 实 际 应 用 中 这 种 情况 当然 不 多 见 ， 因 此 需要 
提供 自 定 义 字 段 名 。 不 过 ， 默 认 将 第 一 个 字段 叫 作 key 是 有 理由 的 : 无 论 采 用 的 是 什么 字段 名 ， 
表 的 主键 永远 都 是 记录 的 第 一 个 字段 。 

















Mnesia 表 与 Erlang 记录 

对 Mnesia 而 言 , 所 谓 的 表 无 非 就 是 一 堆 标 记 元 组 ,而 Erlang 记录 本 质 上 就 是 标记 元 组 ( 参 
见 2.11 节 ), 但 Mnesia 无 法 感知 表 与 同名 -record(...) 上 声明 之 间 的 关系 。 二 者 之 间 的 联系 需 
要 由 开发 者 来 建立 。( 不 强制 关联 所 有 同名 的 表 和 记录 也 是 有 好 处 的 。 有 些 时 候 ， 同 名 表 与 记 
录 之 间 并 没有 联系 。) 

我 们 固然 可 以 按 {attriputes，[title，description]} 的 格式 直接 将 字段 名 写 入 代 
码 ， 但 最 好 还 是 用 record info(fields, RecordName) 米 罗列 字段 名 ， 以 防 今后 修改 记录 
声明 。 请 注意 ，record_info/2 实际 上 并 不 是 真正 意义 上 的 函数 它 只 在 编译 期 有 效 ( 和 
记录 语法 中 的 # 一 样 )， 在 运行 时 或 在 Erlang shell 中 是 无 法 调用 它 的 。 








在 建 表 时 我 们 仅 设 置 了 attributes 选 项 ， 这 意味 着 其 余 选 项 均 采 用 默认 值 ， 具 体 来 说 : 

口 表 既 可 议 也 可 写 ; 

口 表 仅 驻 留 于 RAM 中 (存储 类 型 为 ram_copies ); 

口 表 中 存储 的 记录 与 表 同 名 ; 

口 表 的 类 型 为 set ， 即 每 个 键 最 多 只 能 对 应 一 个 表 项 ; 

口 加 载 优先 级 为 0 ( 最 低 ); 

口 1ocal_content 标 记 被 置 为 false。 

所 有 这 些 选项 中 ,最 重要 、 最 逢 要 搞 明日 的 选项 就 是 表 类 型 和 存储 类 型 。 下 面 我 们 站 和 完 解 释 
一 下 什么 是 表 类 型 ， 等 建 完 表 之 后 再 来 看 看 什么 是 存储 类 型 。 

1. Mnesia 表 的 类 型 

我 们 曾 在 2.14.2 节 提 过 ，ETS 表 可 分 为 多 种 类 型 。Mnesia 表 也 类 似 ， 只 是 候选 类 型 咯 有 不 同 : 
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Mnesia 表 可 分 为 set 刑 、ordered_set 型 和 lpbag 型 3 种 。 和 ETS 表 一 样 ，set 型 表 中 的 键 是 唯一 的 ， 
如 采 新 插入 的 记录 与 现存 的 茶 个 表 项 的 主键 相同 ， 则 新 的 记录 会 覆 蓄 旧 的 记录 。 与 此 相反 ，bag 
型 表 可 以 容纳 多 个 具有 相同 主键 的 记录 , 但 这 些 记录 至 少 要 有 一 个 字段 的 值 不 相等 一 一 同一 条 记 
录 插 入 多 次 是 没 用 的 。 

ordered set 型 表 与 set 型 的 行为 相 同 ， 但 set 型 表 和 bag 型 表 都 采用 哈 希 表 实 现 
orderegd_set 表 则 可 以 按 主键 的 顺序 保存 记录 。 在 需要 按 顺 序 裔 历 所 有 表 项 时 ， 这 一 类 型 的 表 
会 很 有 用 哈 希 表 无 法 保持 具有 实用 价值 的 序 )。 

请 注意 ， 上 述 的 Contributor 表 就 是 bag 型 的 : 

mnesia:create table(contributor, [{type, bag}, ...]) 

也 就 是 说 这 张 表 可 以 容纳 多 条 具有 相同 用 户 ID 的 不 同 记 录 , 进而 可 用 于 表示 参与 了 多 个 项 目 
的 用 户 。 

2. 表 的 存储 类 型 

请 编译 该 模块 并 执行 init_tables () 困 数 ， 然 后 再 次 调用 mnesia:info() 检 查 建 表 绪 


(mymoadqeeer1lLware.corcd)4> cl{(create tables). 


{ok,create tables} 0 建 表 成 功 
(mynodeQ@erlware.org}5> create tables:init tables!(). 

{atomic,ok} 

(mynode@erlware.org}6> mnesia:infol(). 

---> Processes holding locks <--- 

———> Processes waiting for locks <-—-— 



































---> Participant transactions < 一 一 

二 二 二 和 SOore Iinobor Lense ns < 一 一 一 处 于 活动 状态 的 表 
一 一 一 > Uncertain transactions 入 一 一 一 

二 


Contributor : with 0 records occupying 312 words of mem 
Project : With 0 records occupying 312 words of mem 
USser : with DO records occupying 312 words of mem 
schema : with 4 records occupying 752 words of mem 
===> System info in version "4.4.8'", debug level = none <=== 

opt disc. Directory '"/tmp/mnesia'" 1is used. 

use fallback at restart = false 

running db nodes = [mynode@erlware.orgl] 


stopped db nodes = [] 
master node tables = [] 


remote = 9 ram _ copies 型 表 
ram copies = [contributor,project,user] 

disc_ copies = [schemal 

disc_ only_ copies = [] 6 disc_copies 型 表 
[{mynode@erlware.org,disc copies}] = [schema] 

[ {mynode@erlware.org,ram copies}] = [user,project,contributorl] 


5 transactions committed, 3 aborted, 0 restarted, 3 logged to disc 
0 helq locks, 0 in gqueue; 0 local transactions, 0 remote 

0O transactions waits for other nodes: [] 

Ok 


可 以 看 到 init_tables () 执 行 无 误 @, mnesia:info() 显示 ， 现在 有 4 张 表 处 于 活动 状态 @， 
此 前 只 有 1 张 (数据 库 模 式 始 终 占 用 1 张 表 )。 还 可 以 看 到 ， 应 用 中 用 到 的 表 都 是 默认 的 
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ram_copies 类 型 候 。 也 就 是 说 它们 仅 驻 留 于 内 存 ， 这 样 做 可 以 提升 性 能 ， 但 由 于 没有 持久 保存 
数据 ， 一 旦 遭遇 月 湿 或 重启 数据 就 会 丢失 。 

数据 库 模式 表 的 类 型 为 aisc_copies 人 ,表示 它 会 被 写 人 磁盘 ， 因 而 无 惧 重 启 ; 为 了 提高 
读 取 速度 ， 这 些 表 会 被 全 部 加 载 进 内 存 。 最 后 ， 舍 之 后 的 一 行 显 示 当 前 数据 库 中 没有 
disc_only_copies 型 的 表 一 一 表 如 其 名 , 这 些 表 仅 存 储 在 磁盘 上 , 在 访问 速度 上 要 比 其 他 类 型 
的 表 慢 上 许多 。 此 外 ， 目 前 disc_only_copies 类 型 的 表 还 不 支持 orderedqd_set . 

不 同 节 点 上 的 表 可 以 有 不 同 的 存储 类 型 : 比方 说 , 可 以 将 某 张 表 配 置 成 在 一 个 方 点 上 写 人 磁盘， 
在 其 余 世 点 上 仅 驻 留 于 RAM。 该 配置 甚至 文 持 运行 时 修改 ， 无 须 停 机 就 可 以 在 单个 或 多 个 节点 
上 将 一 张 表 从 RAM 型 存储 切换 成 磁盘 型 存储 ， 反 之 亦 然 。 不 过 一 般 来 说 ， 应 该 在 最 初 建 表 时 就 
考虑 好 存储 类 型 。 

现在 ， 所 有 的 表 都 已 经 按 正 确 的 设置 建立 完毕 ,下 一 步 就 该 向 表 中 插入 数据 了 。 为 此 ,还 需 
要 在 create_tables 模 块 中 添加 一 些 代码 。 


9.2.4 ” 问 表 中 录入 数据 


其 他 人 在 插入 数据 时 是 没有 必要 了 人 解 表 的 详情 的 ， 这 些 细节 应 该 由 API 函 数 隐藏 起 来 。 添 加 
API 函 数 的 同时 也 多 出 了 一 个 校 验 机 会 ， 你 可 以 在 插入 数据 之 前 对 数据 进行 一 些 一 致 性 检查 。 比 
如 说 ， 新 添加 的 用 户 至 少 要 参与 一 个 项 目 , 并 且 不 允许 将 用 户 加 为 尚 不 存在 的 项 目的 参与 人 。 添 
加 用 户 和 项 目的 代码 如 代码 清单 9-3 所 示 。 


代码 清单 9-3 ”数据 搬入 函数 























insert userlId, Name, ProjectTitles) when ProjectTitles =/= [] -> 
User = i#¥user{id = Id, name = Name}, 
Fun = fun() -> 9 向 表 中 写 入 用 户 记录 
mesia:write (User}, 
lists:foreacht 
fun({Title) -> 
[#2oroject{title = Title}] = mesia:read{project, Title), 
mnesia:writel(#contributorf{fuser_ id = 1gd, 
project title = Title}) 
end, 
ProjectTitlees) 插入 参与 人 记录 
end, | 
mnesia:transaction (Fun). 
insert project (Title, Description) -> 8 设置 事务 
mnesia:dirty_write(#peroject{title = Title, 
dasoriolron = Description})}). 
将 上 述 代 人 码 加 入 create tables.erl 。 记得 从 模块 中 导出 图 数 insert user/3 和 insert 
project/2。 
1. 事务 


第 一 个 函数 有 3 个 参数 : 新 用 户 的 唯一 用 户 ID 、 用 户 的 姓名 ， 以 及 该 用 户 参 与 的 所 有 项 目的 
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列表 。 请 注意 ,执行 用 户 插 入 操作 的 同时 可 能 还 有 其 他 进程 在 访问 数据 库 ， 这 些 操 作 必 须 相互 隔 
离 。 因 此 应 该 以 事务 方式 执行 用 户 插 入 操作 。Mnesia 的 事务 具备 通常 所 说 的 ACID 性 质 。 
口 原子 性 ( Atomicity ) 每 个 事务 都 是 一 个 不 可 分 割 的 单元 ， 要 么 整体 成 功 ， 要 么 整体 
失败 。 执 行 过程 一 旦 出 现 失败 ， 事 务 便 会 整体 回 深 ， 不 会 对 数据 库 造成 任何 影响 。 
口 一 致 性 ( Consistency ) 一 一 执行 多 个 事务 时 ， 即 便 实 际 执行 时 间 有 所 交 共 ,最 终 的 效果 应 
该 像 是 各 个 事务 按 一 定 的 顺序 顺 次 执行 一 样 ， 整 个 过 程 中 数据 库 的 状态 始终 保持 完整 和 
一 致 。 
口 隔离 性 (Tsolation ) 每 个 事务 都 像 是 拥有 一 个 目 己 的 数据 库 副 本 一 样 ， 多 个 并 发 执行 
的 事务 不 会 相互 干扰 。 在 事务 执行 完毕 之 前 任何 人 都 观察 不 到 事务 的 执行 效果 。 
口 持久 性 ( Durability ) 一 一 事务 执行 成 功 后 ， 它 产生 的 变更 便 会 生效 。 如 果 表 保存 在 磁盘 
上 ， 那 么 无 论 是 重启 还 是 前 省 都 不 会 导致 信息 丢失 。 
在 各 种 复杂 操作 的 执行 过 程 中 , 事务 在 保障 数据 库 完 整 性 方面 起 着 至 关 重 要 的 作用 。Mnesia 
的 事务 非常 简便 一 一 将 你 要 做 的 工作 写 和 一 个 〈 不 含 参数 的 ) fan 表 达 式 ， 然 后 将 之 传 给 
mesia:transaction/1 傅 即 可 。 在 上 述 示 例 中 ,第 一 步 是 将 用 户 记录 写 入 User 表 合 。 接 着 ， 
用 1ists:foreach/2 裔 历 传 入 的 项 目 列表 ， 对 于 其 中 的 每 个 项 目 ， 首 先 检 查 该 项 目 是 否 存 在 于 
Project 表 中 ( 用 期 望 的 结果 [匹配 mnesia:read/2 的 返回 值 )， 然 后 将 相应 的 项 目 参与 人 记录 写 
入 Contributor 表 人 。 上 述 操作 中 任 一 操作 失败 ， 都 会 导致 整个 事务 回 滚 ，Mnesia 的 状态 也 会 恢复 
原样 。 
2. 脏 操 作 
显然 ， 在 添加 用 户 之 前 必须 先 想 办 法 录入 一 些 项 目 。 这 就 是 代码 清单 9-3 中 第 二 个 函数 的 任 
务 。 这 个 国 数 走 了 一 条 捷径 使 用 Tmesia:dirty write/1 陋 数 。 以 di rty_ 为 前 级 的 Mnesia 
哨 数 执行 的 都 是 脏 操 作 , 这 些 操作 在 执行 时 不 会 考虑 事务 或 数据 库 锁 。 使 用 它们 时 必须 格外 小 心 。 
一 般 而 言 ， 比 起 在 事务 中 执行 的 普通 数据 库 操作 ， 脏 操作 要 快 得 多 。 正 确 运 用 脏 操作 可 以 大 
大 提升 应 用 的 执行 速度 。 但 是 当心 一 一 没 考虑 清楚 后 有 果 就 滥用 脏 操 作 的 话 , 很 可 能 会 导致 数据 不 
一 致 。 一 般 来 说 脏 读 比 脏 写 要 安全 ; 但 不 管 怎么 样 ， 只 要 你 心 存 疑虑 ， 就 请 使 用 事务 ! ( 对 于 我 
们 当前 的 应 用 场景 来 说 , 在 应 用 的 运行 过 程 中 突然 插入 一 条 项 目 记 录 并 无 大 碍 ,哪怕 该 记录 会 
产 原 有 记录 也 没有 关系 。) 







































































3. 插入 数据 
现在 该 回 表 中 录入 数据 了 。 请 重新 编译 模块 ， 然 后 在 Erlang shell 中 执行 下 列 命 令 : 
(mynode@erlware.org)7> create tables:insert project (simple cache, "a simple 


cache application"). 
ok 


(mynode@erlware.org)8> create tables:insert user(l,martin, [simple_ cachel]}. 
{atomic, ok} 


上 述 命令 会 向 对 应 的 表 中 搬入 项 目 记 录 、 用 户 记 录 、 项 目 参 与 人 记录 各 一 条 。 执 行 完毕 后 数 
据 库 中 的 内 容 如 图 9-9 所 示 。 
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Project 


simple cache "a simple cache application” 
User 


Contributor 


图 9-9 录入 数据 后 的 Mnesia 表 。User 表 和 Contributor 表 采用 数值 类 型 的 用 户 ID 为 主键 ， 
Project 表 则 采用 原子 类 型 的 项 目 名 称 为 主键 。 每 个 Contributor 表 项 分 别 引 用 一 个 
User 表 项 和 一 个 Project 表 项 


接 下 来 ,来 看 看 如 何 从 表 中 提取 和 查看 数据 ,以便 验证 数据 是 不 是 真 的 已 经 完好 地 存 人 表 中 。 


9.2.5 ”执行 基本 查询 


在 代码 清单 9-3 中 的 ijnsert_user/3 中 我 们 已 经 偷偷 埋伏 了 一 个 read 访 问 。 由 于 使 用 了 事 
务 ， 可 以 直接 调用 mnesia:read/2 洱 数 来 执行 讯 操作。 在 不 使 用 事务 的 情况 下 ， 可 以 使 用 脏 操 
作 来 读 取 数据 库 ， 壁 如 在 Erlang shell 中 可 以 这 样 做 : 


(mynode@derlware.org}9> mnesia:dirty read {contributor, 1}). 
[{contributor, 1, simple cache}] 


无 论 *ead 还 是 airty_read， 返 回 的 都 是 与 查询 条 件 相 匹 配 的 记录 的 列表 一 一 在 上 述 示 例 
中 ， 位 于 结果 列表 中 的 是 Contributor 表 中 所 有 主键 为 1 的 记录 。 如 果 找 不 到 这 样 的 记录 ， 结 果 将 
是 一 张 空 表 。 此 外 ， 前 面 曾 经 提 到 Contributor 表 是 一 张 bag 型 表 。 也 就 是 说 其 中 可 以 有 不 止 一 条 
和 用 户 1 相 关 的 记录 ， 这 些 记 录 全 都 会 被 纳入 函数 返回 的 结果 列表 。 但 对 于 一 般 的 set 型 表 而 言 ， 
读 操 作 返 回 的 列表 要 么 一 个 元 条 都 没有 ， 要 么 就 只 包含 一 个 元 素 。 

1. 使 用 带 匹 配 规范 的 select 

除 按 主 键 查询 以 外 ， 还 有 一 些 更 为 灵活 的 查询 操作 。 下 面 的 例子 展示 的 是 如 何 用 
mnesia:select/2 从 user 表 中 查询 潜在 的 多 条 记录 : 


mnesia:transactiont 












































fun() -> 
mmesia:select (user, [{#user{id = '$1', name = martin}, [], ['$S1']}]; 
end) 


select/2 的 第 一 个 参数 是 竺 查询 的 表 ， 第 二 个 参数 是 所 谓 的 匹配 规范 (matching 
specification )。 这 些 东西 极其 复杂 ， 好 在 在 简单 情况 下 还 算 直 观 。 每 条 匹配 规范 都 是 一 个 形 如 
{Head，Conditions，Results} 的 三 元 组 。Head 是 一 个 Erlang 项 式 ， 用 于 描述 查询 模式 ， 其 
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中 的 '$1' 、'$2' 等 原子 (注意 它们 外 围 的 单 引 号 ) 用 于 表示 变量 。 在 上 述 示例 中 ， 你 所 查询 的 
是 name 字 上 段 为 原子 martin，id 字 上 段 任意 ('$1' ) 的 #user 记 录 。Conditions 部 分 用 于 罗列 作 
用 于 该 匹配 条 件 上 的 额外 的 约束 条 件 ， 一般 情况 下 都 和 这 个 例子 一 样 留 空 。 在 最 后 的 Results 
部 分 中 ， 可 以 描述 要 从 匹配 到 的 每 条 记录 中 生成 什么 样 的 结果 项 式 ; 此 处 可 以 使 用 ' $1' 等 变量 ， 
它们 最 终 会 被 蔡 换 成 匹配 结果 中 相应 的 值 。 

除了 这 些 融 数字 编号 的 变量 ， 还 有 一 些 具有 特殊 含义 的 原子 : 

口 '_'( 仪 限于 在 Head 部 分 使 用 ) 无 所 请， 任意 值 都 可 以 ; 

口 '$_'( 仪 限于 在 Results 和 conditions 中 使 用 ) 一 一 与 查询 条 件 相 匹配 的 整 条 记录 ; 

口 '$$'( 仪 限于 在 Results 和 conditions 中 使 用 ) 一 一 等 价 于 依次 罗列 出 在 Head 部 分 匹 

配 的 所 有 变量 ' $1' 、' $2' 、' $31' 等 。 

事务 执行 成 功 后 ， 返 回 结 果 的 格式 为 {atomic,Data}， 其 中 Data 是 事务 中 用 于 完成 具体 工 
作 的 fun 表 达 式 的 实际 执行 结果 ; 此 人 处 对 应 于 select 调 用 的 执行 结果 一 一 即 一 张 包含 匹配 上 的 所 
有 结果 值 的 列表 。 在 上 述 匹 配 规范 中 ，Results 部 分 为 [' $1'] ， 因 此 匹配 上 的 每 条 记录 只 会 产 
生 一 个 元 素 : 即 该 记录 中 id 字 段 的 值 。 同时 , 由 于 整 张 表 中 只 有 一 条 记录 的 name 字 段 为 martin， 
因而 mmesia:transaction/1 调 用 的 最 终结 果 为 : 

{atomic, [1]} 

对 于 有 多 个 字段 的 表 ， 我 们 往往 只 对 匹配 结果 中 的 在 干 个 字段 感 兴趣 ， 这 时 就 可 以 在 
Results 部 分 采用 [{'$1'，'$2'，'$3'] 或 ['$$'] 等 规范 来 提取 感 兴趣 的 了 字段。 有关 匹 配 规 
范 的 详情 请 参阅 Erlang/OTP 文 档 中 ERTS 的 用 户 手册 。 

2. 使 用 查询 列表 速 构 (QLC) 

最 后 介绍 一 种 表达 能 力 更 为 强劲 的 Mnesia 查 询 手 段 : 查询 列表 速 构 ( Query List 
Comprehension，QLC )。QLC 是 近期 才 加 入 Erlang/OTP 的 内 容 ， 其 工作 方式 颇 为 奇特 。 从 表面 上 
看 ， 它 们 与 普通 的 列表 速 构 很 相似 (参见 2.9 市 ), 但 却 又 必须 航 套 在 外 观 类 似 于 函数 调用 的 
qlc:q(...) 中 使 用 。 实 际 上 外 层 的 qlc:q(...) 只 是 一 个 标记 ， 用 于 让 编译 器 区 别 对 待 其 中 的 
表达 式 。 要 启用 该 功能 ， 模 块 源码 中 必须 加 上 下 面 这 一 行 : 

-include lib("stdlib/include/glc.hrl"). 

(作为 特例 ， 在 Erlang shell 中 可 以 直接 使 用 alc:G(...)， 这 是 因为 shell 中 没有 文件 包含 的 概 
念 。) qlc:q(...) 的 返回 值 是 一 个 查询 句柄 ， 配 合 qlc:eval (Handle) 使 用 便 可 获取 相应 的 查 
询 结 果 。Erlang/OTP 文 档 中 的 stdlib 一 节 对 QLC 做 了 详细 解释 ( 参见 gle 模块 )。 

QLC 是 一 套 通 用 查询 接口 ， 适 用 于 ETS 表 、Mnesia 表 等 各 种 具有 表 的 特征 的 东西 。 通 过 实现 
相应 的 QLC 适 配 带 ， 其 至 可 以 将 QLC 用 在 上 自 定 义 的 表 结 构 上 。 在 使 用 QLC 之 前 ， 首 先 要 用 
mnesia:table (TableName) 国 数 建立 一 个 Mnesia 表 句柄 , 该 句柄 将 被 用 作 QLC 的 输入 参数 。 然 
后 ， 就 可 以 用 普通 的 列表 速 构 语 法 来 实现 各 种 过 滤 和 聚合 操作 了 。 例 如 ， 要 想 实 现 早先 示例 中 
select 子 数 所 实现 的 功能 ， 可 以 这 样 做 : 


mnesia:transactiont 
fun{) 一 > 
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Table = mnesia:table (user), 
QueryHandle = qlc:q([U#user.id || U <- Table, Ui#user.name =:= martin])}), 
dlc:eval (QueryHandle) 

end) 


相 较 于 select 和 [匹配 规范 ，QLC 是 一 一 更 为 优雅 的 查询 接口 。 就 可 读 性 而 言 上 述 代 人 码 比 起 
之 本 的 版 本 要 清晰 得 多 ,代码 的 目的 一 目 了 然 :首先 从 Mnesia 的 user 表 中 找 出 所 有 U#user .name 
等 于 martin 的 用 户 记 录 ; 然后 从 其 中 的 每 个 记录 UU 中 取出 U#user.id, 形成 最 终 的 结果 列表 。 如 
果 数 据 查 询 完 毕 之 后 还 有 别 的 事情 要 做 , 也 可 以 选择 在 事务 中 使 用 QLC 一 一 任何 可 以 在 事务 中 使 
用 的 Mnesia 函 数 都 可 以 与 QLC 混 合 使 用 。 

这 一 节 只 是 对 Mnesia 的 一 个 粗浅 介绍 一 一 要 想 彻 底 说 清楚 Mnesia， 那 得 写 一 本 书 才 行 。 不 过 
仅 就 用 Mnesia 搭 建 分 布 式 绥 存 而 言 ， 这 些 内 容 应 该 是 够 用 了 ， 让 我 们 继续 吧 。 


9.3 基于 Mnesia 的 分 布 式 缓存 


讨论 完 分 布 式 绥 存 的 概要 设计 ， 又 学 习 了 Mnesia 的 基础 知识 ,现在 总 算 可 以 开始 开发 了 。 要 
想 让 设计 中 的 缓存 正常 运转 ， 还 有 以 下 工作 要 做 : 

(1) 用 Mnesia 取 代 ETS ; 

(2) 让 缓存 能 够 识别 出 其 他 节点 ， 从 而 进行 必要 的 通信 ; 

(3) 让 绥 存 具备 资源 探测 能 

(4) 动态 复制 Mnesia 表 。 

首先 进行 第 一 步 ， 这 样 截至 下 一 节 末 尾 的 时 候 ，Mnesia 就 可 以 全 盘 取代 ETS 了 。 












































9.3.1 用 Mnesia 取 代 ETS 


还 记得 第 6 鞋 中 的 sc_store 模 块 吗 ? 键 与 pid 间 的 映射 天 系 表 就 是 由 这 个 横 块 来 封 闻 的 , 它 还 回 
应 用 中 的 其 余 代 码 隐藏 了 存储 相关 的 实现 细 市 。 现 在 ,这 层 封 装 的 意义 终于 凸显 出 来 了 , 虽然 数 
据 存 储 层 需 要 重新 实现 ， 但 应 用 中 其 余部 分 的 代码 却 一 点 儿 也 不 用 改 。sc_store 模 块 ( 代码 清单 
6-6 ) 中 的 关键 函数 有 4 个 : 

DD init/0 

UD insert/2 

lookup/l1 

UD delete/l1 

自 完 是 用 于 设置 ETS 的 init/0, 现在 你 得 用 它 来 设置 Mnesia 表 。 我 们 后 续 还 要 进一步 改造 该 
消 数 ， 以 便 封 效 和 克 余 复制 相关 的 逻辑 ; 这 些 暂 上 且 放 在 一 边 ， 先 把 表 建 好 再 说 。 

1. 改写 init/0 

原先 的 init/0 是 这 样 的 : 

init(}) 一 > 


ets:new(?TABLE_ID, [public, named tablel])})., 
Ok. 
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换 用 Mnesia 后 的 新 版 本 如 下 : 
init(}) 一 > 
mnesia:start{), 
mmesia:create table{({key to pid, 
[{index, [Pid]}, 
{attributes, record info{(fields, key to pid}}]}). 


这 是 一 张 驻 留 在 RAM 中 的 普通 set 型 表 ， 键 不 可 重复 。 和 此 前 一 样 ， recorgd_info 
(fields，...) 会 目 动 罗列 出 表 项 的 所 有 属性 〈 即 字段 ) 的 名 称 。 当 然 ， 还 需要 定义 一 个 与 这 
张 表 同名 的 key_to_pid 记 录 。 既 然 该 应 用 中 与 存储 相关 的 所 有 逻辑 都 在 sc_store 梗 块 中 实现 ,不 
妨 就 在 该 模块 的 起 始 处 定义 这 个 记录 ， 如 下 : 

-record(key to pid, {key, pid}). 

请 注意， 在 定义 表 结 构 时 我 们 用 到 了 {index，[pid]} 选 项 ， 该 选项 用 于 设置 索引 。 所 请 索 
引 ， 其 实 就 是 一 些 额外 的 表 ,， 用 于 加 速 非 主键 字段 的 查询 。 在 创建 索引 时 请 务必 牢记 ， 有 索引 会 占 
用 和 突 外 的 空间 。 更 重要 的 是 , 主 表 上 的 每 一 次 写 操 作 都 会 更 新 索引 ,这 将 导致 启动 速度 和 写 入 速 
度 的 下 降 。 在 使 用 索引 时 请 务必 做 好 利 王 权衡 。 不过， 在 当前 的 应 用 场景 下 ， 为 了 快速 查询 与 给 
定 的 pid 对 应 的 键 ， 这些 额外 的 代价 是 值得 付出 的 ( 这 正 是 我 们 引入 索引 的 目的 )。 

启动 设置 修改 完毕 ， 下 一 步 是 改 与 insert 卫 数 。 

2. 改写 insert/2 

第 6 章 中 的 insert/2 困 数 是 这 样 的 : 


insert (Key，E1qQ) 一 > 
ets:insert(?TABLE ID, {Key, Pid}}. 


对 应 的 Mnesia 版 本 也 同样 人 简单 明了 . 


insert (Key, Pid}) -> 
mnesia:dirty write(#key to pdfkev = Key, Pid = Pid}}. 


请 注意 ， 在 对 表 进 行 更 新 时 我 们 用 的 是 airty_write。 在 这 里 Mnesia 只 负责 最 简单 的 键 值 
存储 , 根本 用 不 到 事务 。 之 所 以 选用 Mnesia, 主要 是 考虑 到 它 的 见 余 复制 功能 , 不 过 这 是 后 话 了 。 

接 下 来 是 1ookup 国 数 ， 也 很 向 单 。 

3. 改写 lookup/1 

原 ETS 版 本 如 下 : 


Jookup (Key) -> 
case ets:lookup{(?TAPBLE ID, Key) of 
[{Key, Pid}] -> {ok, Pid}:; 
[] -> {error, not found} 
end. 


对 应 的 Mnesia 版 本 为 : 


lJookup (Key}) 一 > 
Case mesia:dirty read (key_to pid, Key}) of 
[ {key_to_pid, Key, Pid}] -> {ok, Pid}:; 
[ -> {error, not foundq} 
end,. 
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由 于 是 set 型 表 ， 结 果 中 最 多 只 有 一 条 记录 ， 用 dirty_read 就 够 了 。 很 简单 吧 。 

但 还 有 一 个 问题 : 在 分 布 式 环境 下 ， 你 有 可 能 会 查 到 无 效 的 pid。 不 妨 考 虑 以 下 场景 : 假设 
有 a、Dp 两 个 节点 ， 移 在 运行 于 节点 a 上 的 缓存 中 插入 一 些 数 据 ， 然 后 到 节点 b 上 进行 查询 ， 这 时 
是 可 以 读 取 到 正确 的 值 的 。 现 在 强制 终止 节点 a,， 再 到 b 上 进行 查询 , 会 发 生 什 么 呢 ? 显然 操作 会 
失败 。 因 为 位 于 节点 a 上 的 存储 进程 篆 已 灰 飞 烟 天 ， 而 Mnesia 数 据 库 中 的 那些 pid 却 仍然 义无反顾 
地 指 回 这 些 进 程 。 综 上 ， 必 须 想 个 办 法 来 清理 那些 包含 无 效 pid 的 表 项 。 

最 简单 的 解决 方案 就 是 在 执行 查询 操作 时 ， 对 数据 库 中 查 到 的 pid 做 检查 。 以 下 本 数 用 于 判 
定 给 定 的 pid 所 指向 的 进程 是 否 仍 然 存 活 : 

is _ pid alivelPid) when node{(Pid) =:= node{() -> 

1s_ process_alive(Pid).; 
is pid alivetPid}) -> 


lijsts:member (node (Pid}), nodes(}} andalso 
(rpc:call (node(Pid}), erlang, is process alive, [Pid]}) =:= true). 


有 了 它 ， 只 需 再 在 lookup 国 数 中 加 上 一 个 检查 就 可 以 了 : 


Jookup (KeY) 一 > 
case mnesia:dirty read (key to pid, Key) of 
[{key to pid, Key, PidG}] -> 
Case is Pid alivel(Pid) of 
true -> {ok, Pid}: 
false -> {error, not found} 











end:; 
上， 这 
{error, not_found)} 
End. 
采用 这 个 方案 ， 失 效 的 pid 仍 然 会 留存 在 Mnesia 中 ， 直 到 对 应 的 表 项 被 删除 或 被 覆盖 为 止 。 
不 过 没有 关系 ， 因 为 ookup 函 数 会 忽略 无 效 的 pid。 请 仔细 考虑 一 下 ,要 想 高 效 地 清理 失效 的 pid 
该 怎么 做 ?” 为 此 需要 改动 哪些 模块 ? 
最 后 ,要 改写 的 困 数 就 只 剩 下 delete 了 .在 用 Mnesia 蔡 换 ETS 的 过 程 中 这 是 唯一 的 一 处 挑战 。 
4. 改写 delete/1 
此 前 的 aelete 困 数 如 下 : 


delete{Pid) -> 














ets:match delete(?TABLE ID, {' ', Pid}}). 
改写 后 的 版 本 如 下 : 
按 pid 查询 表 项 
delete{Pid}) -> 
case mnesia:dirty index read{(key to pid, Pid, i#key to pid.pPid) of 


[#key_to pid{} = Record] -> 
mnesia:dirty_delete_object (Record),;} 

-> dt 
ok 


end. 
在 执行 删除 操作 时 可 能 会 出 现 两 种 情况 : 要 人 么 键 原本 就 不 存在 ( 可 能 已 经 被 删 控 了 )， 要 人 么 
键 存 在 并 被 成 功 删 除 。 无 论 是 哪 种 情况 ,都 应 该 返回 ok。 删 除 操作 具有 用 等 性 一 一 也 就 是 说 同一 
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操作 反复 执行 多 次 ， 结 果 相 同 。 如 果 能 找到 与 给 定 的 键 相 对 应 的 key_to_pid 记 录 ， 将 之 删除 ， 
否则 就 直接 返回 ok 人 @，。 

请 仔细 看 看 我 们 是 怎样 仅 任 pid 来 定位 相应 的 表 项 的 上 .这 段 代 码 展示 了 Mnesia 索 引 的 用 法 : 
操作 索引 时 需要 使 用 一 些 专 用 于 索引 的 国 数 (上 面 用 到 的 这 个 郴 数 属于 脏 操作 函数 )。 以 
index_read/3 为 例 ， 它 的 第 一 个 参数 是 表 名 ， 第 二 个 参数 是 待 检索 的 键 〈 即 pid )， 第 三 个 参数 
则 用 于 指定 希望 使 用 哪个 索引 来 进行 检索 〈 一 张 表 可 以 有 多 个 索引 )。 指 定 索 引 时 用 的 是 索引 字 
段 的 编号 ， 该 编号 可 以 通过 #recordname .fieldname 语 法 获得 。 此 外 ,还 可 以 通过 在 建 表 时 给 
定 的 索引 名 ( 即 原子 piq ) 来 指定 索引 ， 但 这 样 做 会 略微 拖 慢 操作 的 执行 速度 。 除 去 这 些 区 别 ， 
该 亢 数 与 普通 的 谈 取 操作 一 般 无 二 。 

还 不 算 太 复杂 ， 是 吧 ? 现在 ,缓存 应 用 的 存储 系统 已 经 完全 由 Mnesia 接 管 ， 而 且 在 整个 改造 
过 程 中 我 们 只 修改 了 sc_store 模 块 ， 该 模块 以 外 的 代码 一 行 都 没有 改 。 丰 后续 的 分 布 式 学 习 中 ， 
你 能 否 继续 这 种 简洁 明快 的 设计 风格 呢 ? 让 我 们 拭目以待 吧 。 


9.3.2 ”让 缓存 识别 出 其 他 节点 


下 一 步 , 我 们 需要 让 集群 中 的 所 有 缓存 实 例 都 能 识别 出 彼此 。 这 实际 上 是 在 为 路 实例 数据 同 
步 修 桥 铺 路 ， 走 完 这 一 步 才能 实现 所 有 实例 间 的 数据 共 圣 。 对 于 刚 启 动 的 缓存 方 点 来 说 ,第 一 要 
务 就 是 尽快 加 入 集群 。 在 这 一 小 方 中 ， 针 对 这 一 问题 我 们 给 出 了 一 种 简便 的 解决 办 法 。 市 点 加 入 
集群 的 途径 有 很 多 ， 而 我 们 提供 的 方案 可 谓 既 简单 又 务实 。 

在 该 方案 下 新 节点 将 通过 两 个 长 期 运行 的 空白 Erlang 节 点 来 加 入 预先 约定 的 集群 。 这 两 个 
上 氮 不 执行 任何 用 户 代 码 ( 因而 几乎 永远 不 会 宕 机 )。 你 只 需要 启动 它们 ， 给 它们 分 配 恰 当 的 书 点 
名 ， 并 设置 好 用 于 集群 认证 的 cookie 就 可 以 了 : 


erl 一 name contact1 -setcookie xxxxxxxx 






































erl -name contact2 -setcookle XxxXxXxXxXxx 

新 启动 的 缓存 节点 将 按 事先 配置 的 节点 名 去 ping 这 两 个 节点 ， 如 图 9-10 所 示 。 图 中 的 两 个 
net_adm:ping/1 调 用 只 要 能 有 一 个 成 功 ,启动 过 程 便 能 够 得 以 继续 ;否则 市 点 将 无 法 加 入 集群 ， 
启动 过 程 就 此 宣告 失败 并 抛 出 月 演 转 储 文件 。 





net_ adm:ping(...) 联络 节点 1 





net_adm:ping(...) 


图 9-10 “新 节点 通过 事先 已 知 的 、 永 久 可 用 的 联络 节点 目 动 加 入 集群 : 这 个 办 法 既 
简单 又 有 效 。 两 个 联络 节点 最 好 分 别 运 行 于 不 同 的 物理 机 上 
相关 代码 该 放 在 哪儿 就 不 用 多 说 了 吧 ? 仔细 想 想 应 用 的 启动 过 程 就 一 目 了 然 了 ,应 用 启动 时 
首先 调用 的 因数 是 sc_app :start/2，6.4.2 节 中 的 sc_store:init() 也 是 加 在 此 处 。 由 于 在 初 
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始 化 存储 系统 之 前 ， 市 点 之 间 必 须 连 通 ， 节 点 加 入 集群 的 代码 自然 也 得 放 在 这 里 了 。 

代码 清单 9-4 列 出 了 需要 添加 到 sc_app 中 的 代码 。 请 注意 在 start /2 中 新 增 的 那 一 行 ， 这 一 
行 试图 用 ok 去 匹配 ensure_contact () 的 调用 结果 。 这 实际 上 是 一 个 断言 : 调用 结果 必须 是 ok， 
否则 就 会 触发 一 个 baqmatch 异 常 。 这 是 一 条 “不 成 功 便 成 仁 ” 的 约定 : 要 么 如 你 所 愿 连 接 成 功 ， 
要 么 start/2 抛 出 异常 ， 宣 告 应 用 启动 失败 。 


代码 清单 9-4 ”在 应 用 启动 时 加 入 集群 ( sc app.erl) 
startt_ StartType, _StartArgs) -> 
ok = ensure contact()}), | 在 start () 中 加 入 这 一 行 


sec_store:1init!(), 





case sc_ sup:start link() of 
{ok, Pid} -> 
{ok, Pid}; 
EYIOIL -> 
EIrIOr 
end. 
ensure contact{(}) 一 > 
DefaultNodes = ['contactl@localhost', 'contact2adlocalhost'], 
Case get_env (simple cache, contact nodes, DefaultNodes) of 
[] -> 
{error, no contact nodes}; 查询 联络 节点 的 配置 信息 


ContactNodes 一 > 
ensure contact (ContactNodes) 





engd. 
ensure contact (ContactNodes} 一 > 
Answering = [N || N <- ContactNodes, net_adm:ping(N) =:= pong], 
Case Answering of 
[] 一 > 二 
{error, no_contact nodes reachable}: Eng 列表 中 的 市 点 
-> 
DefaultTime = 6000， 
WaitTime = get_env (simple cache, wait_ time, DefaultTime), 
walit_for nodes{length(Answering), WaitTime)} 
Cp 查询 等 待 超时 的 配置 信息 
wait_for PoaQes (MinNodes, WaitTime}) -> 
Slices = 10， 
SliceTime = round (WaitTime/Slices), 了 
wait_ for nodes (MinNodes, SliceTime, Slices). 
wait_for nodes{( MinNodes, _SliceTime, 0) -> 
Ok; 
wait for nodes (MinNodes, SliceTime, Iterations}) -> .9 检查 是 否 已 经 连 上 了 足够 多 
case lengthinodes(})} > MinNodes of 的 节点 
true 一 > 
Ook; 
false -> 
timer:sleep {SliceTime), 
wait for nodes (MinNodes, SliceTime, Iterations - 1) 
end. 
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Get_env (ApPpName, Key, Default) 一 > 
case application:get env (AppName, Key) of 
undefined -> Default; 6 查询 配置 信息 
{ok, Value} -> Value 
end. 


这 堆 代 码 看 上 去 虽然 多 ,但 却 一 日 7 然 。 基 本 流程 如 下 : 

口 查询 联络 衣 点 的 配置 信息 (或 采用 便 编码 的 默认 配置 ); 

口 ping 所 有 联络 节点 ， 收 到 应 答 后 才能 继续 

口 查询 等 竺 超时 配置 〈 或 采用 默认 住 )， 用 于 等 竺 来 目 其 他 节点 的 连接 ; 

口 等 待 来 日 其 他 市 点 的 连接 ， 一 和 卫 等 到 连通 市 点 数 多 于 最 初 给 出 应 答 的 市 点 数 为止 (或 者 

一 卫 等 到 不 耐烦 ， 然 后 假定 目 己 是 头 一 个 加 入 集群 的 工作 慷 点 )。 

和 应 用 配置 相关 的 问题 我 们 留待 下 一 革 再 详细 讨论 。 至 于 现在 , 能 有 一 个 负责 读 取 配 置信 息 
的 函数 就 可 以 了 @。 工具 了 涵 数 get_env (AppName, Key, Default) 价 单 包装 了 application: 
get_env (AppName，Key) ， 在 找 不 到 对 应 配置 时 它 会 返回 默认 值 。 首 次 调用 该 量 数 的 是 
ensure_contact () 图 数 ， 目 的 是 获取 联络 节点 列表 @。 此 外 ,由 于 尚未 加 上 配置 信息 ,我 们 临 
时 插入 了 两 个 硬 编 码 的 默认 节点 名 。 

拿 到 联络 节点 列表 后 ， 下 一 步 就 是 调用 ensure_contact (Nodes) ,该 函数 将 尝试 用 
net_adm:ping/1 联 络 所 有 节点 各 .请 注意 这 里 用 到 了 列表 速 构 , 既 向 所 有 节点 发 出 了 ping 请 求 ， 
又 收集 了 所 有 应 答 节 点 的 节点 名 ， 一 举 两 得 。 如 果 所 有 节点 都 联络 不 上 ， 就 直接 放弃 。 和 否则 再 检 
查 一 次 配置 ， 找 出 用 于 等 待 集群 中 所 有 节点 达到 全 连通 状态 的 超时 时 间 候 (同样 ,为 了 应 对 配置 
缺失 ， 此 处 也 便 编 码 了 一 个 默认 值 )， 然 后 默默 地 坐等 其 他 下 点 的 出 现 。 

wait_for_nodes/2 旺 数 首先 把 等 待 时 间 切 成 了 和 在 干 个 时 间 片 ， 然后 进入 等 竺 循环 @。 在 每 
个 时 间 片 开始 时 ， 郴 数 检查 当前 连通 节点 的 总 数 是 否 大 于 最 初 给 出 应 答 的 联络 节点 的 总 数 @@. 如 
采 是 , 便 假定 集群 中 的 所 有 市 点 都 已 连通 。 否 则 ,就 再 等 待 一 个 时 间 厂 并 重复 上 述 检查 。 如 果 耻 
到 最 长 等 待 时 间 结 束 都 没有 新 的 市 点 出 现 ， 那 也 无 妨 ， 继续 执 行 便 可 (在 这 种 情况 下 ,你 可 以 假 
定 目 己 是 除 联络 市 点 以 外 第 一 个 加 入 集群 的 节点 )。 
























































小 心 使 用 配置 信息 

用 于 读 取 配置 文件 的 函数 是 不 具备 引用 透明 性 的 : 传 给 函数 的 参数 不 再 是 函数 返回 值 的 唯 
一 决定 因素 "。 在 函数 式 编程 中 ， 不 要 把 这 类 逻辑 埋藏 到 代码 深 处 。 把 它们 扒 出 来 ， 布 置 到 程 
序 的 最 上 层 ( 放 到 初始 化 部 分 中 )， 尽 量 打扮 得 显眼 一 些 。( 在 上 述 场景 中 ， 只 有 start/2 函 
数 需要 读 取 配 置 。) 遭 循 这 条 实践 原则 ， 代 码 将 更 多 于 维护 和 重 构 。 函 数 的 引用 透明 性 越 强 ， 
代码 的 行为 就 越 容 易 推 断 ， 调 整 代码 时 也 就 越 容 易 判 断 影响 范围 。 








有 了 这 些 代码 , 你 便 能 够 确保 集群 中 的 所 有 市 点 在 监督 树 启动 之 前 全 部 连通 ( 应 用 的 其 余部 
分 要 在 监督 树 局 动 之 后 才 会 依次 展开 )。 下 一 步 ， 我们 要 用 资源 探测 来 定位 集群 内 的 其 他 


只 还 取决 于 配置 文件 的 内 容 。 一 一 译 者 注 
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Sjmol e_cache 实 例 。 


9.3.3 用 资源 探测 定位 其 他 缓存 实例 


在 这 一 市 里 , 我 们 会 把 上 一 章 中 搭建 的 资源 探测 系统 集成 到 simple_cache。 资源 探测 是 一 
个 通用 服务 ， 无 论 是 什么 应 用 ， 只 要 它 需 要 搜寻 Erlang 集 群 内 的 资源 实例 ， 都 可 以 使 用 该 服务 。 
从 这 个 角度 考虑 ,你 不 会 硕 望 把 资源 探测 系统 便 塞 在 绥 存 应 用 之 内 。 相 反 , 我 们 应 该 把 它 组 织 成 
-个 单独 的 应 用 ， 放 在 与 simple_cache 并 列 的 目录 结构 中 。 
此 处 不 再 歼 述 应 用 的 详细 创建 过 程 一 一 整个 过 程 你 应 该 已 经 熟 答 于 心 了 , 就 留 给 你 作为 练习 
吧 。 和 此 前 一 样 ， 你 需要 建立 应 用 的 目录 结构 ， 并 编写 相应 的 ,app 文件 、 app 模块 ， 和 _ sup 模块 
(用 于 局 动 8.3.3 节 中 编写 的 资源 探测 服务 需 ) 全 部 搞定 之 后 ,应 该 得 到 两 个 目录 结构 并 列 的 应 用 ， 




















如 下 所 示 : 
1ib 
|- simple_cache 
| |- src 
|- ebin 


| [|- ... 
|- resource discovery 
|- src 
|- ebin 


四 
此 外 ， 还 需要 给 simple_cache 增 加 两 个 依赖 项 ， 即 resource_dqiscovervy 和 mnesia。 代 
但 清单 9-$ 中 列 出 了 更 新 后 的 Simple _ cache.app, 不 仅 加 入 了 上 述 两 个 依赖 项 , 还 列 出 了 第 7 章 中 的 
事件 日 志 模 块 〈 请 与 6.3.2 节 中 初始 版 本 的 ,app 文件 进行 对 照 )。 


代码 清单 9-5 ”更 新 后 的 simple_cache.app 文 件 


{application, simple cache, 
[{description, "A simple caching system"}, 
{vesn, "0.3.0"}, 





{modules, [simple cache, 
SC Aapp, 
sc_sup, 
sc_element_sup, 
Sc Store, 
sc_ element, 


ScC_event, 

sc_event logger]}, 加 入 了 新 的 依赖 项 一 
{registered, [sc_supl}, 
{applications, [kernel, sasl, stdlib, mnesia, resource discovery]}, < 


imod, {sc_app,|[]}} 
] } . 


框 洪 工作 呐 定 完毕 ， 现 在 请 仔细 考虑 一 下 我 们 所 要 实现 的 功能 。 一 方面 需要 将 本 地 的 缓存 实 
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例 公布 给 他 人 使 用 , 另 一 方面 还 需要 定位 集群 中 的 其 他 缓存 实例 。 回 忆 一 下 第 8 草 中 资源 探测 服务 
的 工作 原理 ， 要 实现 这 两 点 并 不 困难 。 要 想 进行 发 布 ， 只 需 将 每 发 布 的 本 地 资源 放 入 资源 探测 服 
务 角 (用 以 表达 “供给 ”什么 资源 )， 该 资源 应 以 simple_cache 为 类 型 ， 以 市 点 名 为 资源 引用 
(一 个 节点 上 最 多 上 只 能 有 一 个 simple_cache 实 例 ， 因 而 有 节点 名 就 足够 了 ) 写成 代码 就 是 : 

resource discovery:add local resource(simple cache, node{),) 

要 搜寻 其 他 缓存 实例 ， 只 需要 告诉 服务 器 “需求 ”类 型 为 simple_cache 的 资源 实例 就 可 
以 了 : 

resource discovery:add target resource typelsimple cache， 

最 后 一 步 就 是 癌 集 群 中 的 其 余 节 点 发 起 资源 交换 请 求 , 接着 耐心 等 待 一 段 时 间 ， 直至 资源 信 
县 交换 完毕 〈 这 套 欣 源 探 测 系统 具有 较 强 的 异步 性 ， 因 而 等 竺 是 必要 的 ): 


resource discovery:trade resources (), 
timer:sleep(?WAIT FOR RESOURCES), 


很 明显 ， 这 段 代 码 也 应 该 加 到 sc_app:start/2 国 数 中 ， 位 置 紧 随 esnsure_contact () 调用 
之 后 。 详 情 参 见 代 码 清单 9-6。 


代码 清单 9-6 ”资源 探测 相关 的 修改 〈sc_app.erl ) 


-define (WAIT FOR RESOURCES, 2500). 



































startt StartType, _StartArgs}) -> 
Ok = ensure contact(), 
resource discovery:add local resource(simple cache, node(})., 
resource discovery:add target resource type{simple cache), 
resource discovery:trade resources(}, 
tijmer:sleep(?WAIT FOR RESOURCES ) ， 
Sc _ store:initt{), 
Case sc sup:start link{} of 
{ok, Pid} -> 
{ok, Pid}; 
ErYYOr 一 > 
ErYIoOr 
End,. 


很 傈 单 吧 ? 你 已 经 于 别 出 了 集群 中 的 所 有 绥 存 实例, 同时 它们 也 都 认 出 了 你 。 现 在 只 差 最 后 
一 步 了 ， 还 需要 对 Mnesia 进 行 一 些 调 整 ， 以 便 与 集群 中 其 他 的 节点 对 接 进 而 复制 它们 的 数据 。 

















9.3.4 动态 复制 Mnesia 表 


好 啦 ， 很 快 就 要 大 功 告 成 了 。 稍 事 休 整 ， 欣 党 一 下 你 的 大 作 吧 。 细 细 回 味 一 下 : 你 的 系统 中 
几乎 不 存在 任何 静态 配置 一 一 只 有 一 些 起 引导 作用 的 代码 外 加 两 个 用 于 帮助 新 市 点 接 入 集群 的 
联络 节点 一 一 系统 将 会 自动 探测 出 所 有 simple_cache 实 例 并 复制 它们 的 数据 ， 整套 系统 高 度 动 
态 ， 而 且 具 备 民 好 的 容错 性 。 

路 节点 的 元 余 复 制 其 实 也 没有 多 复杂 , 不 过 你 还 是 得 多 了 解 一 下 Mnesia 在 分 布 式 环境 下 的 运 
作 方 式 才 行 。 和 元 余 复 制 相关 的 代码 放 在 sc_store:init/0 内 ， 当 启动 过 程 进 行 到 这 一 阶段 时 ， 
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方 点 已 经 与 集群 连通 ， 资 源 探 测 也 已 经 完成 (参见 代码 清单 9-6 )。 这 部 分 代码 有 一 些 难度 ， 我 们 
把 它 拆 成 了 几 个 部 分 ， 然 后 逐一 展开 讨论 。 
将 ETS 蔡 换 成 Mnesia 之 后 的 sc_store:init/0 如 下 (参见 9.3.1 节 ): 
1nit() 一 > 
mmesia:startt{), 
mesia:create table(key_ to pigd, 


[{index, [Pid]}, 
{attributes, record info(fields, key to pid}}]). 
以 此 版 本 为 基础 ， 再 加 上 资源 探测 : 
nit(}) 一 > 
mnesia:stopt{), 
mnesia:delete schemal [node{)])}), 
mnesia:start(), 
{ok, CacheNodes} = resource discovery:fetch resources (simple cache), 
Qynamic db init(ljists:delete{node()}, CacheNodes)}). 


该 函数 的 第 一 要 务 是 确保 Mnesia 正 党 局 动 ， 与 此 同时 清理 挥 本 地 方 点 上 现存 的 数据 库 模式 。 
在 数据 面前 , 这 段 代码 坚 无 顾忌 , 不 假 思 过 地 将 原 数 据 库 中 的 模式 和 表 抹 了 个 一 干 二 兆 。 不 过 没 关 
系 ， 毕 葛 这 只 是 个 缕 存 : 所 有 的 数据 都 是 以 ram_copies 方 式 保存 的 一 一 包括 数据 库 模 式 在 内 。 在 
删除 数据 库 模 式 前 ,必须 先 俘 止 Mnesia。( 在 Mnesia 尚 未 局 动 时 , 调用 mnesia:stop() 是 无 害 的 。) 

完成 清理 工作 之 后 ，init () 会 从 资源 探测 系统 中 取出 此 前 识别 出 的 所 有 simple_cache 实 例 。 
( 前面 曾经 提 过 , 我 们 是 用 节点 名 来 区 分 这 些 实例 的 。) 本 地 的 绥 存 实例 也 包含 在 返回 的 缓存 节点 列 
表 中 ， 将 它 吻 除 ， 然 后 进入 下 一 阶段 : 详情 参见 下 列 代码 清单 中 的 aynamic_qb_init/1 国 数 : 


代码 清单 9-7 根据 市 点 探测 情况 来 初始 化 Mnesia 
dynamic db init([]) -> 
mesia:create table(key_to_pid, 
[{index, [pid]}., 
{attributes, record infol(fields, key to pid}} 
] ) ; 
dynamic db init(CacheNodes) -> 
add_ extra nodes (CacheNodes). 


根据 集群 中 是 否 存 在 其 他 缓存 节点 ， 该 图 数 会 采取 不 同 的 数据 库 初 始 化 策略 。 困 数 的 第 一 个 
子 句 用 于 人 处理 整个 集群 中 只 有 当前 这 一 个 缓存 方 点 的 情况 ,处理 手 法 与 9.3.1 广 相同 。 虽然 清理 完 
原 有 数据 库 模 式 之 后 还 没有 调用 mnesia:create_schema/1, 但 实际 上 Mnesia 已 经 在 RAM 中 建 
立 了 全 新 的 模式 。 一 个 完整 的 simple_cache 实 例 就 此 启动 完毕 , 后 续 加 入 集群 的 实例 邵 将 可 以 
从 它 那 里 复制 数据 。 

如 有 果 探 测 到 集群 中 的 其 他 simple_cache 实 例 ， 就 进入 第 二 个 子 句 。 在 这 种 情况 下 ， 我 们 转 
而 从 集群 中 的 其 他 节点 处 拉 取 数据 。 相 关 人 逻辑 由 add_extra_nodes/1 通 过 遍历 所 有 远程 方 点 来 
实现 ， 如 代码 清单 9-8 所 示 。 
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必须 有 一 个 市 点 先行 启动 

有 一 点 请 千 万 注意 , 第 一 个 启动 的 节点 必须 独自 完成 启动 过 程 ,。 如 果 两 个 simple cache 
节点 同时 启动 , 就 有 可 能 会 产生 竞 态 条 件 ， 导致 双方 都 认为 对 方 是 先 启 动 的 那 一 个 。 其 后 果 就 
是 初始 数据 库 模 式 永远 也 建立 不 起 来 。 为 了 避免 这 种 情况 ,我们 可 以 再 加 一 些 代 码 来 进行 同步 。 
不 过 简洁 起 见 ， 暂 且 先 这 样 吧 。 





代码 清单 9-8 连接 其 他 Mnesia 节 点 并 复制 其 上 的 数据 
-define (WAIT_ FOR_TABLES, 5000). 


add_extra_nodes([Node|T]) -> meu | 


case mesia:change config(lextra db nodes, [Node]) of 换 本 地 模式 
{ok, [Node]} -> 


mnesia:ada table copy (schema, node(), ram copies), 
mnesia:ada table copy (key_to_ pid, node(}, ram copies}), 
Tables = mnesia:system infol(tables), 
小 SL 下 十 上 
mnesia:wait for +ables(Tables，?WAIT FOR TABLRS) ; 继续 尝试 其 他 节点 
> 
add extra nodes {T) 


end. 

这 个 函数 还 具 是 干 了 不 少 事情 ， 好 在 逻辑 还 算 清 晰 。 它 首先 调用 了 mnesia:change_ 
config/2， 计 Mnesia 青 癌 数 据 库 中 添加 一 个 节点 。Mnesia 的 工作 方式 与 Erlang 市 点 类 似 : 只 要 连 
上 上 一 个 实例 ,就 可 以 与 所 有 实例 连通 ， 因 此 只 要 连 上 一 个 远程 实例 就 行 了 。 请 注意 ,在 上 述 情况 
下 连接 是 由 新 的 空 日 厄 点 问 存 有 数据 的 节点 发 起 的 , 不 过 无 所 请; Mnesia 随 后 会 更 新 本 地 的 市 点 
列表 ( 远程 方 点 上 的 也 会 更 新 ), 数据 库 方 点 至 此 添加 完毕 。( 这 种 方式 只 能 用 于 添加 刚刚 启动 的 、 
完全 基于 RAM 和 存储， 日 数据 库 模 式 为 空 的 方 态 。) 

如 果 出 于 某 些 原 因 连 接 未 能 成 功 ， 就 继续 尝试 列表 中 的 其 他 节点 人 @。( 如 果 所 有 节点 都 连 不 
上 ， 由 于 我 们 没有 处 理 市 点 列表 为 空 的 情况 ,代码 将 会 表演 ,进而 导致 启动 失败 。 这 又 是 一 个 放 
任 朋 淡 的 例子 ， 在 这 种 情况 下 你 也 的 确 是 无 能 为 力 。) 

如 果 连 接 成 功 , 首先 在 本 地 节点 上 复制 一 份 远 程 数 据 库 的 模式 人 @。 该 模式 将 会 取代 本 地 节点 
上 临时 的 空 日 模式 。 接 者 青 用 同样 的 手法 复制 key_to_pid 表 。 这 才 终 于 达成 了 你 真正 的 目的 一 一 
在 绥 存 实例 间 共 有 圣 key_to_pid 表 。 最 后 ， 调 用 mnesia:system_info (tables) 罗 列 出 当前 效 
据 库 中 所 有 的 表 ， 再 调用 mnesia:wait_for_ tables/2 等 竺 新 表 的 内 容 同步 完毕 。( 第 二 个 参 
数 表示 超时 ， 即 便 在 这 段 时 间 内 同步 未 能 完成 ， 局 动 过 程 也 会 继续 。) 

大 功 告 成 ! 看 看 吧 : 一 套 文 持 动态 元 余 复制 的 分 布 式 缓存 。 放 到 shell 中 去 跑 跑 看 : 启动 两 个 
方太 ,将 它们 连通 ， 从 一 个 市 点 插入 数据 ， 再 从 为 一 个 上 进行 查询 。 在 你 构建 的 系统 中 ， 刍 与 进 
程 间 的 映射 关系 被 存放 在 一 张 文 持 元 余 复制 的 表 中 。 有 了 这 套 系 统 , 集群 中 任何 绥 存 实例 都 可 以 
在 此 存储 映射 关系 , 还 可 以 查找 与 指定 的 键 相关 联 的 进程 标识 人生， 从 而 与 对 应 的 进程 耳 接 进行 通 
信 (无 论 进程 位 于 哪个 市 点 )， 进 而 读 取 或 更 新 与 键 相 关联 的 值 。 
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运行 该 系统 时 , 首先 像 先 前 一 样 在 独立 的 终端 窗口 中 局 动 一 到 两 个 联络 方 点 (对 于 使 用 短 方 
点 名 的 集群 请 使 用 -sname 选 项 ): 

$ erl -sname contact1 

事前 请 务必 先 把 simple_cache 和 resource discovery 应 用 中 的 所 有 .erl 文 件 都 编译 
成 .beam 文 件 ， 并 放 入 相应 的 ebin 目 录 ， 壁 如 可 以 这 样 做 : 


erlc -0o ./simple cache/ebin ./simple cache/src/*.erl 
erlc -0o ./resource discovery/ebin ./resource discovery/src/*.erl 


然后 按 以 下 方式 启动 Erlang: 

$ erl sname mynode -pa ./simple cache/ebin -pa ./resource discovery/ebin 

在 启 动 s impl e_cache 之 采 记 得 先 启 动 其 他 几 个 它 所 依赖 的 应 用 参见 代码 清单 9-5 中 的 .app 
文件 ): 


1> application:start (sasl)}. 

ok 

2> mnesia: start!t{). 

ok 

3> application:start (resource discovery). 
ok 

4> application:start (simple cache)}). 

OK 


受 资 源 探测 功能 的 影响 ，simple_cache 的 启动 过 程 会 被 耽搁 儿 秒 钟 。 如 有 果 simple_cache 
找 不 到 联络 节点 ， 首 先 请 确认 是 否 所 有 节点 都 以 -sname 局 动 ， 然 后 检查 sc_app:ensure_ 
contact () 中 的 默认 市 点 名 ， 如 果 localhost 不 管用 ， 请 将 之 修改 成 实际 的 主机 名 改 完 之 后 
记得 重新 编译 )。 

可 以 按 同样 的 方式 多 开启 儿 个 市 点 (分 别名 为 nynodel、mynode2……: )， 每 个 市 点 分 别 占 
据 一 个 独立 的 终端 窗口 ,运行 着 相 同 的 应 用 。 然 后 试 厦 在 一 个 市 点 上 写 缓存 ， 再 从 为 一 个 市 点 上 
读 取 数据 。 看 吧 ， 行云流水 。 











9.4 ”小结 


在 这 一 草 中 , 我 们 初步 学 习 了 Mnesia 套 极为 灵活 的 分 布 式 数据 存储 系统 。 在 利用 Mnesia 
改写 缓存 应 用 的 存储 后 端的 过 程 中 , 代码 其 余部 分 几乎 没有 受到 任何 影响 。 与 此 同时 ,我 们 还 实 
现 了 一 套 简 单 的 逻辑 ， 确 保 绥 存 节 点 能 够 自动 加 入 Erlang 集 群 。 最 令 人 印象 深刻 的 是 ， 我 们 还 集 
成 了 第 8 章 中 的 资源 探测 系统 ， 进 而 使 集群 中 的 所 有 缓存 实例 都 具备 了 相互 动态 复制 Mnesia 表 的 
能 力 。Erlware 的 家 伙 们 一 定 很 兴奋 , 会 话 存储 的 问题 终于 得 到 了 解决 。 现 在 即便 同一 用 户 的 请 求 
被 先后 转发 至 不 同 的 Web 服 务 嚣 ， 也 不 会 出 现 糟 糕 的 用 户 体验 了 。 

在 下 一 章 中 , 此 行 终 将 迎 来 一 个 圆满 的 句号 。 我 们 会 将 这 些 代 码 整理 成 一 份 随 时 可 发 布 到 线 
上 使 用 的 发 布 镜像 ( release )。 等 迈 出 这 一 步 ， 你 便 正 式 踏 上 Erlang 专 家 之 路 了 。 
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打包 、 服 务 和 部 置 





本 章 慨 要 

口 目标 系统 、 应 用 和 发 布 镜像 
口 如 何 定义 和 局 动 发 布 镜像 
口 发 布 镜像 的 打包 和 安 次 





时 至 今日 ， 你 已 经 学 习 了 不 少 内 容 , 包括 OTP 行 为 模式 的 运用 、OTP 应 用 的 创建 、 日 志和 事 
件 的 处 理 、 分 布 式 应 用 的 编写 ， 还 有 Mnesia 数 据 库 的 使 用 。 下 一 个 任务 ， 就 是 把 所 有 这 些 代 码 融 
为 一 体 ， 为 最 终 的 部 署 做 好 准备 。 

OTP 应 用 可 以 被 视 作 一 种 功能 单元 ,它们 封 狼 了 各 种 功能 ,提供 了 一 定 的 便利 , 但 这 种 封装 
仅 限 于 Erlang 编 程 层 面 。 要 想 打 造 出 一 整套 完备 而 独立 的 软件 服务 一 一 也 就 是 那些 在 在 网 络 中 的 
一 侣 或 多 台 机 需 上 运行 ， 与 其 他 系统 或 用 户 进 行 交 互 的 东西 一 一 还 需要 把 运行 在 同一 Erlang 运 行 
时 系统 上 的 多 个 应 用 捆绑 到 一 起 。 在 OTP 中 ， 我 们 把 这 种 更 高 层次 的 软件 包 称 作 发 布 镜 像 
( release )， 在 某 台 主机 上 安 痛 发 布 镜像 后 ， 便 形成 了 目标 系统 ( target System )。 

标准 Erlang/OTP 发 行 版 中 包含 大 量 应 用 ， 其 中 不 乏 第 5 草 中 的 那些 图 形 化 运行 时 工具 。 目 标 
系统 则 不 同 , 一 般 来 说 ,它们 只 会 包含 自 喘 提供 服务 所 必需 的 那些 应 用 。 不过， 每 个 目标 系统 至 
少 都 会 包含 stdlib 和 kernel 这 两 个 基础 应 用 ， 出 于 日 志方 面 的 需求 ， 往 往 还 会 包含 SASL 应 用 。 

在 详细 讲解 如 何 创建 发 布 镜像 之 前 , 我 们 先 回 过 头 来 仔细 审视 一 下 应 用 , 看 看 在 当前 阶段 这 
个 概念 还 纺 含 大 哪些 值得 我 们 关注 的 要 点 。 


10.1 从 系统 的 角度 看 应 用 


OTP 应 用 通常 痢 是 些 具备 自主 运转 能 力 的 东西 ,它们 由 多 个 运行 看 的 进程 组 成 ,运行 时 行为 
和 生命 周期 也 各 不 相同 。 与 典型 编程 语言 中 的 库 相 比较 ， 它 们 更 像 是 Web 训 览 锅 或 Web 服 务 角 之 
类 的 独立 应 用 软件 。 在 启动 OTP 应 用 时 , 一般 会 同时 局 动 多 个 长 期 运行 的 进程 ， 其 中 某 些 进程 其 
至 会 随 着 整个 系统 一 直 运 行 下 去 。 

Erlang 的 目标 系统 由 多 个 运行 中 的 应 用 组 成 。 这 些 应 用 有 看 类 似 的 结构 和 元 数据 ， 管 理 方式 
也 一 致 。 
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10.1.1 结构 





所 有 应 用 都 具有 相同 的 基本 结构 ,如 图 10-1 所 示 。application 行 为 模式 封 妆 了 应 用 的 司 停 。 
局 动 之 后 , 每 个 应 用 在 运行 时 部 会 有 一 个 根 监 督 者 ， 直接 或 间接 地 管理 春 应 用 中 的 所 有 其 他 进程 
(其 中 也 包括 子 系统 的 监督 者 )。 














图 10-1 ”应 用 在 运行 时 的 一 般 结 构 。 所 有 OTP 应 用 的 启 停 方式 和 管理 方式 都 是 统一 的 。 
这 大 大 简化 了 将 应 用 打包 成 发 布 镜 像 的 过 程 


应 用 意味 看 一 任性 一 一 它 统 一 了 行为 模式 的 打包 和 管理 方式 。 所 有 应 用 部 有 着 标准 的 目录 结 


构 、 定 义 清 晰 的 入 口 ， 以 及 规范 的 监督 结构 。 在 将 多 个 独立 应 用 打包 成 发 布 镜 像 的 过 程 中 ,这 种 
一 致 性 使 得 大 部 分 步 又 得 以 月 动 化 。 











10.1.2 ”元 数据 


大 部 分 应 用 都 是 目 主 运转 的 ， 而 不 仅仅 是 静态 的 库 。 为 了 了 解 应 用 的 局 动 方式 、 应 用 之 间 的 
依赖 关系 等 知识 ，OTP 需 要 掌握 一 些 信息 。 这 些 信息 就 包含 在 .app 文 件 中 。 在 我 们 当前 的 项 目 中 
有 两 个 应 用 : resource discovery 和 simple cache。 它 们 叉 分 别 依赖 于 kernel、stdlib、sasl 和 mnesia 
等 标准 OTP 应 用 。 














依赖 关系 与 传递 性 
应 用 之 间 往 往 会 存在 依赖 关系 , 璧 如 simple cache 应 用 直接 依赖 于 kernel 和 stdlib 应 用 ( 实 0 
际 上 所 有 应 用 都 直接 依赖 于 这 两 个 应 用 )， 以 及 mnesia、resource discovery 和 sasl 应 用 。 推 而 
广 之 ， 应 用 之 间 也 可 能 存在 间接 依赖 。 如 下 图 所 示 ， 假 设 应 用 A 依赖 于 应 用 B， 而 也 又 依赖 
于 应 用 C， 鉴 于 依赖 关系 的 传递 性 ， 我 们 说 应 用 A 间接 依赖 于 应 用 C。 
间接 依赖 


(4) 吉 接 依赖 (3s ) 吉 接 依赖 Le 


依赖 天 系 的 传递 性 。 由 于 应 用 A 和 直接 依赖 于 应 用 BB， 而 应 用 B 又 直接 依赖 于 应 用 C， 
此 应 用 A 间接 依赖 于 应 用 C 


simple_cache 当 前 的 ,app 文件 看 起 来 应 该 是 这 样 的 : 
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代码 清单 10-1 应 用 元 数据 : simple_cache.app 
{application, sijmple cache, 
[{description, "A simple caching system"}, 
{ven, "0.3.0"}, 
{modules, [simple_cache, 
sc_app, 
SC_SuUP ， 
SC_element sup, 
sc_store, 
se_element, 


sc_event, 

sc_event logger]}, 
{registered, [sc sup]}, 
{applications, [kernel, sasl, stdilib, mesia, resource discoveryl]}, 
{mod, 41486 ap [J]}} 


1}. 
从 应 用 管理 的 角度 看 ,这些 元 数据 部 是 不 可 或 缺 的 ,其 中 有 一 项 元 数据 对 发 布 镜像 尤为 重要 ， 
那 就 是 vsn 元 组 ， 用 于 指定 应 用 的 当前 版 本 。 








10.1.3 ”系统 如 何 管理 运行 中 的 应 用 


sc_app 等 application 行 为 模式 的 实现 模块 就 是 OTP 应 用 的 局 动 入 口 (参见 .app 文 件 )。 这 些 
檬 块 提 供 了 应 用 的 启 停 接口 ; 此 外 ， 还 有 一 个 与 application 行 为 模式 对 应 的 行为 模式 容 硕 ， 
叫 作 应 用 控制 器 (application controller )， 系 统 中 当前 运行 看 的 所 有 应 用 都 是 由 它 来 管理 的 。 应 用 
的 start/2 回 调 困 数 应 该 在 应 用 局 动 完 毕 后 返回 新 局 动 的 根 监督 者 进程 的 pid， 容 需 将 通过 该 pid 
来 追踪 应 用 。 从 这 个 角度 来 看 , application 行 为 模式 与 第 7 革 中 的 gen_event 行 为 模式 很 类 似 : 
二 者 都 采用 单个 容 右 管理 行为 模式 的 多 个 实现 模块 ( 参见 图 7-1 )。 

1. 应 用 控制 器 

每 个 运行 时 系统 中 只 有 一 个 应 用 控制 入 ， 其 注册 名 为 application controller。 从 下 列 示例 中 可 
以 看 出 ， 该 进程 的 标识 符 数 值 很 小 ， 可 见 在 Erlang 运 行 时 系统 的 局 动 过 程 中 ， 应 用 控制 名 很 早 就 
被 局 动 起 来 了 : 

Eshell V5.7.4 (abort with ^G) 


1> registered!(). 
[kernel_sup,global _ name_ server,inet db,init,file server_ 2， 











Code server,erl prim loader,user drv,standard error, 
application controller,error_ logger,kernel_safe_ sup,user., 
global group,standard error sup,rex] 








2> whereis{({application controller). 
<0.6.0> 


控制 硕 还 负责 加 载 应 用 的 .app 文 件 ， 并 且 会 检查 当前 应 用 所 依赖 的 其 他 应 用 是 否 都 已 经 局 
动 。 应 用 控制 大 会 为 运行 中 的 每 个 应 用 铂 生 一 对 应 用 主 控 进 程 , 从 而 把 目 己 与 应 用 代码 隅 离开 来 
(参见 图 5-3 )。 目 前 而 言 ， 你 还 不 必 关 注 这 些 额 外 的 进程 ， 不 过 仍然 有 必要 了 解 它 们 是 容 需 整体 
功能 的 一 部 分 一 一 尤其 是 在 调试 的 时 候 。 尽 管 application 行 为 模式 容器 的 内 部 结构 比 大 多 数 
行为 模式 都 要 复杂 ， 但 application 模 块 提供 的 API 却 很 简洁 。 



































图 灵 社 区 会 员 for(;)(13433955876@163.com) 专 享 尊重 版 权 


10.2 制作 发 布 镜 像 213 


2. 应 用 的 启动 类 型 

在 用 application:start (AppName) 启动 应 用 时 ,应 用 的 启动 类 型 默认 为 Lemporary。 也 
就 是 说 ， 就 算 应 用 意外 终止 ， 运 行 时 系统 的 其 他 部 分 也 不 会 受到 影响 ， 只 会 生成 一 份 朋 沉 报 告 。 
然而 ， 如 果 通 过 调用 application:start (AppName, permanent) 局 动 ， 应 用 就 会 被 认为 是 目 
标 系 统 中 不 可 或 缺 的 组 成 部 分 : 无 论 出 于 什么 原因 ， 只 要 应 用 终止 ， 整个 运行 时 系统 也 会 随 之 关 
闭 ， 只 能 重新 启动 。( 还 有 一 种 启动 类 型 是 transient ,但 对 于 普通 OTP 应 用 来 说 ， 它 和 
permanent 是 一 样 的 0 ) 系统 的 重启 可 以 交 由 外 部 操作 系统 中 的 心 跳 进 程 来 处 理 ， 详情 请 参见 
Erlang/OTP 文 档 中 的 heart 模 块 ( 它 是 kernel 应 用 的 一 部 分 )。 

在 这 一 市 中 , 我 们 从 系统 的 角度 强调 了 应 用 的 一 些 要 点 , 现在 让 我 们 来 看 看 如 何 将 应 用 组 织 
成 发 布 镜像 ， 进 而 构筑 独立 的 Erlang 系 统 。 


10.2 制作 发 布 镜像 


Erlang/OTP 的 功能 封闭 是 分 层 的。 位 于 最 底层 的 是 模块 ， 用 于 封 北 人 代码。 模块 进而 会 被 组 织 
成 应 用 ,用 于 对 动态 的 行为 模式 和 更 为 融 级 的 功能 进行 封 案 。 最终， 应 用 又 会 被 进一步 组 织 成 发 
布 镜像 。 


10.2.1 发 布 镜像 


厂 干 应 用 ， 再 加 上 一 些 元 数据 , 便 构 成 了 发 布 镜像 。 其 中 的 元 数据 用 于 描述 如 何以 系统 的 方 
式 局 动 和 管理 这 些 应 用 。 同 一 发 布 镜像 中 的 应 用 都 在 同一 僚 Erlang 运 行 时 系统 上 运行 ， 这 就 是 目 
标 系 统 。 目 标 系 统 是 经 过 裁剪 的 运行 时 系统 ， 只 能 用 于 运行 发 布 镜 像 中 的 应 用 。 从 这 个 角度 讲 ， 
发 布 镜像 也 可 以 被 当 作 一 种 定义 服务 的 手段 : 将 运行 中 的 Erlang VM 视 作 一 个 系统 级 服务 ， 正 如 
Web 服 务 需 将 Simple cache 视 作 Web 服 务 需 的 一 个 黑箱 服务 一 样 。 

发 布 镜像 中 不 仅 包 含 用 于 实现 其 主要 功能 的 应 用 , 还 包含 这 些 应 用 直接 或 间接 依赖 的 其 他 应 
用 。 辟 如， 在 发 布 镜像 中 肯定 会 有 Simple _ cache 和 resource _ discovery， 二 者 分 别 依赖 于 和 在 干 其 他 
应 用 ， 这 些 应 用 又 进一步 依赖 于 更 多 应 用 ， 所 有 这 些 应 用 全 部 都 有 要塞 到 发 布 镜像 里 去 。 

除了 括 定 应 用 的 版 本 号 ， 发 布 镜 像 上 月 身 也 有 一 个 版 本 扣 。 人 例如， 图 10-2 中 的 发 布 镜像 
simple cache-0.1.4 中 包含 应 用 simple cache-0.3.0 、resource discovery-0.1.0 、 kernel-4.5.6 和 
stdlib-6.0.5。 版 本 号 是 发 布 镜 像 的 重要 属性 之 一 。 

总 结 一 下 就 是 : 

口 发 布 镜像 描述 的 是 可 运行 的 Erlang 运 行 时 系统 ; 

口 每 个 发 布 镜像 都 有 一 个 版 本 所 ; 

口 发 布 镜像 是 由 一 系列 向 版 本 号 的 应 用 和 用 于 描述 系统 管理 策略 的 元 数据 共同 构成 的 ; 

口 将 发 布 镜 像 安 疲 到 主机 上 ， 就 形成 了 目标 系统 。 

在 Erlang/OTP 的 整个 生态 系统 中 , 发 布 锐 像 是 一 个 非常 重要 却 又 经 党 被 人 误解 的 概念 。 下面 ， 
我 们 就 来 带 你 一 起 创建 simple_cache 的 发 布 镜 像 , 很 快 你 就 会 发 现 它 根本 没有 传说 中 的 那么 复杂 。 
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simple _ cache 
rclcasc 0.1.4 


。 resource_ simple_ 
图 10-2 ”发 布 镜 像 和 版 本 控制 。 每 个 发 布 镜像 都 市 有 一 个 版 本 字符 串 ， 其 中 每 个 应 用 
又 各 有 一 个 版 本 号 







kernel 4.5.6 























10.2.2 ”准备 发 布 代码 


创建 发 布 镜像 的 一 般 步 又 如 下 : 

(1) 确定 需要 包含 哪些 应 用 ; 

(2) 创建 用 于 描述 发 布 镜像 内 容 的 元 数据 ( .rel ) 文件 ; 

(3) 创建 启动 脚本 ; 

(4) 创建 系统 配置 文件 〈 可 选 ， 但 一 般 都 会 需要 ); 

(5) 将 所 有 内 容 打 包 成 单个 文件 。 

我 们 将 带 你 逐一 完成 这 些 步骤 。 在 了 解 确切 做 法 之 后 你 便 会 发 现 整个 过 程 一 点 儿 都 不 难 。 首 
先 ， 选 出 需要 塞 括 到 发 布 镜像 中 的 应 用 。 

日 前 ， 我 们 自行 开发 的 应 用 一 共有 两 个 : simple cache 和 resource discovery。 对 于 一 套 目 标 
系统 而 言 ， 要 想 将 simple_cache 当 作 服 务 来 运行 ， 这 两 个 应 用 缺 一 不 可 ( 因为 simple_cache 用 到 了 
resource_discovery ), 除 此 以 外 ,被 它们 下 接 或 间接 依赖 的 应 用 也 必须 早 插 在 内 ,包括 stdlib、kernel、 
sas|， 还 有 mnesia。 接 下 来 ， 就 该 创建 .rel 文 件 了 。 


10.2.3 发布 镜像 的 元 数据 文件 


正如 每 个 应 用 部 市 有 一 个 用 于 存放 应 用 元 数据 的 .app 文 件 ， 发布 锐 像 里 也 有 一 个 用 于 存放 元 
数据 的 发 布 镜 像 文 件 ， 其 扩展 名 为 .rel。 发 布 镜像 元 数据 的 主要 内 容 是 一 张 列表 ， 其 中 包含 该 发 
布 镜像 中 的 所 有 应 用 。 此 外 , 还 有 一 些 内 容 需要 指定 , 譬如 , 为 了 保证 应 用 能 在 同一 版 本 的 Erlang 
运行 时 系统 (ERTS ) 下 编译 和 运行 ， 必 须 指 定 ERTS 的 版 本 号 。 

在 开发 过 程 中 ,发 布 镜像 文件 放 在 哪里 都 无 所 谓 。 毕 竟 ， 只 有 在 构建 发 布 镜像 时 它 才 会 发 挥 
作用 。 也 许 你 会 把 它 放 到 与 代码 完全 无 天 的 地 方 。 你 也 有 可 能 会 用 到 多 个 发 布 锐 像 文件 ( 文件 名 
不 同 )， 以 便 从 同一 份 代码 中 创建 出 不 同 的 发 布 镜像 包 。 甚 至 ， 你 还 可 以 用 别人 发 给 你 的 代码 来 



































创建 发 布 镜像 。 
如 9.3.3 市 所 述 ， 当 前 的 目录 结构 中 (至少 ) 应 该 含有 两 个 应 用 的 子 目 录 : 
1ib 


|- simple_cache 
| | -ebin 
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|- resource discovery 
| | -ebin 





父 目录 名 不 一 定 要 叫 lib， 但 不 管 这 个 目录 叫 什 么 ,在 本 章 中 ， 它 就 是 存放 .rel 文 件 以 及 其 他 
跟 发 布 镜像 相关 的 文件 的 地 方 。 在 运行 后 续 的 各 个 示例 时 ， 请 将 它 设 为 当前 目录 。 等 你 摘 清 楚 了 
发 布 镜像 的 工作 机 制 ， 便 可 以 在 实际 的 开发 过 程 中 视 上 自己 的 工作 流程 需要 来 进行 调整 了 。 

代码 清单 10-2 展 示 的 是 simple_cache:rel 文 件 的 内 容 ， 它 将 成 为 我 们 创建 发 布 镜像 的 基础 。 首 
先 请 确保 resource_discovery 和 和 simple_cache 的 版 本 与 .app 文 件 中 相应 的 应 用 版 本 相同 。 根据 所 安装 
的 Erlang 版 本 的 不 同 ,你 可 能 还 需要 调整 erts 、kernel、stdlib、sasl 和 mnesia 的 版 本 ( 现在 暂时 先 别 
动 它们 )。 


代码 清单 10-2 simple cache.rel 


{release, 




















{"simple cache", "0.1.0"}, 
{ertes, ?SD.7.2"}, 
[ {kernel, "2,13.2"}, 
{stdlib, 1.16.2"}, 
{sasl, 2.1.5.3"}, 
{mmnesia, "4.4.10"}), 
{resource discovery, "0.1].0"}., 
{simple cache, "0.3.0"} 
] }. 


和 .app 文 件 一 样 ，.rel 文 件 中 也 是 一 个 由 句点 结尾 的 Erlang 元 组 。 这 个 元 组 由 4 个 元 对 组 成 。 其 
中 第 一 个 是 原子 release。 紧 随 其 后 的 是 由 发 布 镜像 的 名 称 ( 是 字符 串 , 不 是 原子 ) 及 版 本 构成 
的 二 元 组 。 和 应 用 的 版 本 一 样 ， 发 布 镜像 的 版 本 字符 串 内 容 任意 , 但 是 考虑 到 用 户 的 感受 和 对 各 
种 第 三 方 工具 的 兼容 性 ， 最 好 还 是 遵循 传统 的 版 本 字符 串 格 式 吧 。 

第 三 个 元 素 用 于 指定 ERTS 的 版 本 。 这 是 一 个 二 元 组 ， 由 原子 erts 和 所 需要 的 Erlang 运 行 时 
系统 的 版 本 字符 串 组 成 。 请 注意 ，ERTS 的 版 本 并 非 Erlang/OTP 发 行 版 的 版 本 ( 壁 如 R13B03 )。 要 
查看 ERTS 的 版 本 ， 请 启动 Erlang shell: 


S erl 






































Erlang R13BO3 (erts-5.7.4) [smp:2:2] [ra:2] lasync-threads:0. 


Eshell V5.7.4 (abocort with ^G) 
1> 


输出 结果 的 第 一 行 中 ， 紧 随 文 本 Erlang R13B03 之 后 的 就 是 ERTS 的 版 本 ， 即 5.7.4。 查 看 版 本 
的 另 一 个 办 法 是 呼出 BREAK 菜 单 〈 人 参见 2.1.4 节 ) 后 进入 选项 v: 
工 > 
BREAK: {a}bort (ciontInue (PDFroc info (1L)nto (1)oaded 
(v})ersion (kK)ill (D}b-tables (d}istribution 


Erjang {BEAM) emulator version 5.7.4 
Compiled on Tue Nov 24 11:12:28 2009 
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现在 ， 请 根据 自己 当前 安装 的 系统 版 本 对 :rel 文件 中 的 srts 项 进行 修改 。 

Tel 元 组 中 的 第 四 个 〈 同 时 也 是 最 后 一 个 ) 元 素 是 一 张 列 表 ， 其 中 包含 了 发 布 镜像 中 的 所 有 
应 用 的 名 称 和 版 本 。 在 这 里 ， 我 们 不 仅 列 出 了 主 应 用 simple_cache， 还 列 出 了 它 的 直接 依赖 和 间 
接 依赖 : resource _ discovery 、mnesia、sas1， 甚 至 还 包括 stdlib 和 Kernel 应 用 。 在 此 必须 完整 地 列 出 
目标 系统 所 需 的 所 有 应 用 , 不 仅 包 括 你 编写 的 应 用 ,也 包括 它们 和 直接 和 间接 依赖 的 所 有 应 用 。 要 
想 确定 其 余 应 用 的 版 本 ， 最 简单 的 办 法 就 是 参照 下 一 他 中 make_script 国 数 的 执行 结 

-Tel 文件 只 是 一 个 整体 规范 。 运 行 时 系统 无 法 在 局 动 时 读 取 它 即便 能 够 读 取 ， 它 也 无 法 
提供 足以 让 系统 正常 局 动 运行 的 信息 。.rel 文 件 并 未 指出 ERTS 可 执行 文件 的 位 置 ， 也 没有 说 明 到 
哪儿 才能 找到 文件 中 列 出 的 各 个 应 用 。 对 于 真正 的 Erlang/OTP 目 标 系 统 而 言 ， 这 些 信息 应 该 在 系 
统 启动 前 准备 就 绕 才 行 。 接 下 来 , 我 们 将 教 你 如 何 将 这 些 信息 与 配置 文件 等 其 他 必需 品 打包 到 一 
起 ， 进 而 创建 出 可 用 于 立刻 启动 目标 系统 的 完整 的 发 布 镜像 规范 。 


10.2.4 ”脚本 与 启动 文件 


-Tel 文件 是 我 们 迈 出 的 第 一 步 , 距 离 真正 可 运行 的 Erlang/OTP 目 标 系 统 还 有 一 段 距离 。 接 下 来 ， 
为 了 更 加 完善 地 描述 系统 的 启动 过 程 ， 还 需要 创建 两 个 文件 ， 它 们 就 是 .script 和 .boot 文 件 。 其 
中 .script 文 件 内 包含 一 份 完 整 的 规范 ， 所 有 应 用 的 内 容 明 细 全 部 都 罗列 在 内 ， 包 括 应 用 的 路 径 、 
需要 加 载 的 模块 ， 以 及 其 他 各 种 必要 信息 。.boot 文 件 则 是 .script 文 件 的 二 进 制 形式 ， 可 供 Erlang 
运行 时 系统 在 启动 时 和 下 接 读 取 。 

要 想 创建 这 两 个 文件 ， 必 须 先 启 动 一 个 Erlang VM，:rel 文 件 中 提 及 的 所 有 应 用 的 路 径 都 必须 
在 VM 局 动 前 设置 好 。 对 于 打算 纳入 发 布 镜像 却 又 不 在 默认 路 径 下 的 应 用 (也 就 是 除 Erlang/OTP 
自身 以 外 的 所 有 应 用 )， 可 以 用 -pa 命令 行 参 数 ( 参见 4.3 市 ) 来 将 之 加 入 代码 路 径 。 以 下 命令 可 
以 在 启动 shell 的 同时 将 simple cache 和 resource discovery 应 用 的 ebin 目 录 加 入 代码 路 径 。 请 在 .rel 
文件 所 在 的 目录 下 执行 该 命令 : 

erl -pa ./simple cache/ebin -pa ./resource discovery/ebin 

下 一 步 就 是 调用 systools 模 块 (SASL 应 用 的 一 部 分 ) 来 生成 真正 的 .boot 和 .script 文 件 , 方 
法 如 下 : 


1> systools:make script ("simple cache", [locall}). 
ok 


该 命令 执行 完毕 后 ， 当 前 目录 下 会 生成 两 个 文件 : simple_cache.script 和 simple_cache.boot。( 如 果 
命令 报错 称 .rel 文 件 中 的 版 本 号 不 对 ， 请 根据 自己 本 地 系统 的 情况 更 新 .rel 文 件 ， 然 后 再 次 执行 该 
A 


命令 。) 


感 兴趣 的 话 ， 可 以 打开 .script 文 件 瞧 一 瞧 一 一 里 面 的 内 容 大 致 如 下 : 


SS Script generated at fdqaatel {time} 






















































































{Script, 
{"'Ssimple cache”, 0O.1.07}, 
[{preLoaded, [...1}, 
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该 文件 由 数 百 行 Erlang 项 式 构成 ， 完 整地 摘 述 了 系统 的 整个 局 动 过 程 。 你 不 一 定 非 得 摘 明 白 
这 些 内 容 ， 不 过 要 是 修改 了 .script 文 件 ， 请 记得 调用 systools:script2boot (Release) 重新 生 
成 .boot 文 件 。 





local 参数 主要 用 于 测试 

在 调用 make_script/2 函数 时 ， 传 入 的 local 选项 的 作用 在 于 将 所 有 应 用 的 绝对 路 径 
写 入 .script 和 .boot 文件 ， 也 就 是 说 ， 在 用 这 份 .boot 文件 启动 系统 时 ， 所 有 相关 应 用 的 位 置 必 
须 与 创建 .boot 文 件 时 各 应 用 所 在 的 位 置 相 同 。 对 于 测试 来 说 local 选项 很 合适 ， 但 这 种 方式 
的 可 移植 性 不 太 好 ， 不 一 定 适 合 于 生产 环境 。 


传 给 make_script/2 的 local 选 项 主要 用 于 人 免除 安装 过 程 ， 以 便 简 化 针对 系统 启动 过 程 的 
测试 (我们 很 快 就 要 开始 了 )。 如 果 不 采 用 local 选 项 ， 生 成 的 .script 和 .boot 文 件 会 认为 所 有 应 用 
都 位 于 文件 系统 中 的 某 个 名 为 lib 的 日 录 下 , 该 目录 的 具体 位 置 由 系统 变量 sRooT 指 定 。 在 需要 将 
发 布 镜像 安装 至 多 台 路 径 不 尽 相 同 的 主机 上 时 , 这 种 方式 尤为 合适 ; 不 过 就 目前 而 言 ,采用 local 
选项 更 加 方便 一 一 我 们 的 应 用 还 在 开发 中 ， 尚 未 达到 能 够 在 文件 系统 中 的 任意 位 置 落地 的 阶段 。 

















10.2.5 “系统 配置 


simple cache 发 布 镜像 就 快 创建 完毕 了 。 就 当前 这 个 发 布 镜像 而 言 ， 最 后 一 件 需 要 操心 事情 
就 是 配置 文件 。 你 应 该 还 记得 ， 在 第 9 半 中 我 们 加 入 了 用 于 读 取 配置 的 代码 ， 但 当时 生效 的 实际 
上 是 代码 中 的 默认 值 ( 参见 代码 清单 9-4 )。 现在， 该 来 创建 发 布 镜 像 的 配置 文件 了 。 

配置 文件 的 标准 文件 名 为 sys.config。 实 际 上 只 要 扩展 名 是 .config， 文 件 名 叫 什么 无 所 谓 。 
跟 .app 文 件 和 ,rel 文件 一 样 ， .config 文 件 的 内 容 也 是 一 个 由 句点 结尾 的 Erlang 项 式 。 simple cache 
的 sys.config 文 件 内 容 如 下 所 示 : 


代码 清单 10-3 ”sys.config 配 置 文件 
[ 


SS write log files to sasl dir 
{Sasl, 


[ 




















{Sasl error logger, {file, /tmp/simple cache.sasl log"}} 
1 6 SASL 日 志 路 径 
{simple_cache, 

[ 


SS Contact nodes for use in JjJoining a cloud 


{contact nodes, ['contactlile@ljocalhost', 'contact2Q@1localhost!’:]} 
] } 
] . 联络 节点 的 节点 名 


在 每 个 .config 文 件 中 ,项 式 的 最 外 层 都 是 一 张 二 元 组 列表 。 其 中 的 每 个 二 元 组 都 对 应 于 一 个 
应 用 ， 由 应 用 的 名 称 和 一 张 表 示 应 用 选项 的 键 值 对 列表 构成 。 上 面 的 sys.config 文 件 指 定 了 sasl 
用 的 错误 日 志 输 出 位 置 人 以 及 simple_cache 应 用 中 联络 节点 的 节点 名 人 @ (请 与 9.3.2 节 中 的 代码 进 
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行 对 比 )。 
现在 ,发布 镜像 中 的 各 个 组 成 部 分 都 已 经 准备 就 绰 ， 如 图 10-3 所 示 。 准 备 局 动 它 吧 。 


sys.config 
文件 











| .Script > .boot 
文件 文件 


图 10-3 ”发 布 镜像 的 各 个 组 成 部 分 。.rel 文 件 指明 了 需要 包含 的 应 用 ， 用 于 生成 .script 
和 .boot 文 件 。sys.config 文 件 是 可 选 的 ， 但 通常 都 会 用 上 








10.2.6 ”启动 目标 系统 


现在 ， 必 要 部 件 已 经 齐备 ， 可 以 启动 系统 了 。 在 关 手 启动 之 前 ,还 需要 指定 两 样 东西 : 即 局 
动 系统 时 应 该 使 用 哪个 .boot 文 件 和 哪个 .config 文 件 。 在 本 例 中 , 这 两 个 文件 都 位 于 目标 系统 的 根 
目录 下 。 因 此 ， 应 该 使 用 下 列 命令 启动 系统 ( 简便 起 见 此 处 采用 了 -sname 选 项 ): 

erl -sname cache -boot ./simple cache -config ./sys 

不 要 忘 了 ,还 需要 至 少 局 动 一 个 联络 节点 〈 人 参见 9.3.2 节 ) 才 行 。 联络 市 点 的 节点 名 务必 要 与 
代码 清单 9-4 中 便 编码 的 默认 值 或 sys.config 中 配置 的 节点 名 保持 一 臻 。 这些 节 点 也 要 用 -sname 户 
动 (不 能 用 -name )， 否 则 它们 将 无 法 与 缓存 方 点 共同 构成 集群 。 

执行 上 述 命令 将 会 打开 一 个 Erlang shell， 这 就 表示 系统 启动 成 功 了 。SASL 的 输出 被 重 定 问 
至 sys.config 指 定 的 文件 之 中 , 因而 启动 过 程 中 的 输出 不 再 像 以 前 那样 天 碎 一 一 可 以 通过 核实 日 志 
文件 的 内 容 来 确认 系统 是 否 运作 正 第 。 在 生产 环境 中 局 动 目标 系统 时 , 通常 你 并 不 期 望 打开 shell， 
而 是 期 望 系统 以 守护 进程 的 形态 在 后 台 运 行 。( 可 以 在 其 他 和 点 上 通过 远程 shell 来 登录 在 后 台 运 
行 的 系统 ， 参 见 8.2.6 市 。) 这 也 不 难 ， 只 需 在 命令 行 中 加 上 -aetached 选 项 即 可 。 

erl -sname cache -boot ,/simple cache -config ,/sys -detached 

不 过 就 目前 而 言 , 在 前 台 运 行 的 shell 会 话 才 是 我 们 需要 的 东西 ， 这 样 才能 快速 验证 发 布 镜像 
的 运行 状况 。 要 进行 验证 , 可 以 使 用 Appmon( 参见 5.1 节 )。 从 运行 目标 系统 的 shell 中 局 动 Appmon: 


> appmon: start(). 
{ok,<0.72.0>} 


这 样 就 能 看 到 Appmon 的 主 和 窗口 了 了 ， 如 图 10-4 所 示 。 
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图 10-4 Appmon 的 主 窗 口 ， 展 示 在 发 布 镜像 中 运行 的 应 用 





如 你 所 见 ， 在 simple_cache.rel 中 作为 依赖 项 列 出 的 所 有 应 用 都 启动 起 来 了 (除了 和 映 为 库 应 用 
的 stdlib )。 大 功 告 成 ，Erlang 目 标 系 统 运行 成 功 ， 太 酷 了 ! 

目标 系统 还 有 一 种 启动 方法 ， 就 是 在 命令 行 中 加 入 -modqe embeqdqed 选 项 。 在 默认 交互 模式 
下 ，Erlang 会 按 需 动态 加 载 模块 ， 你 可 能 已 经 习 以 为 浓 了 。 但 对 于 骸 入 式 目 标 系统 而 言 ， 这 种 模 
式 却 不 一 定 适 用 ， 其 至 它们 有 可 能 根本 不 文 持 在 运行 时 加 载 其 他 代码。 当 Erlang 系 统 以 舱 入 式 模 
式 启动 时 , 它 会 在 局 动 的 同时 根据 局 动 脚 本 加 载 所 有 代码 ; 此 后 , 在 要 加 载 其 他 模块 或 是 调用 未 
加 载 过 的 模块 ， 都 会 失败 。 详 情 请 参见 Erlang/OTP 官 方 文 档 。 

还 可 以 试 试 -detatched 选 项 。 采用 这 种 方式 启动 的 系统 将 在 后 台 运 行 , 不 会 打开 shell。 不 
过 ， 如 采 在 联络 节点 的 shell 内 调用 nodqes () ， 仍 然 可 以 在 结 采 中 看 到 分 离 的 万 点 ， 可 以 针对 该 
点 局 动 一 个 远程 shell ( 参见 8.2.6 六 ) 来 对 它 执行 各 种 操作 ， 比 如 调用 init :stop() 便 可 关闭 
让 把 。 

在 下 一 闻 中 ， 我 们 将 把 新 鲜 出 炉 的 发 布 镜像 打包 成 单个 文件 ， 从 而 简化 安 闻 和 部 署 过程。 


10.3 ”发布 镜像 打包 


现在 ， 发 布 镜 像 已 经 定义 翌 当 , 为 了 简化 后 续 的 安 闻 、 分 发 和 部 署 过 程 ， 可 能 需要 对 它 进 行 
打包 。OTP 提 供 了 和 者 干 实用 功能 来 文 持 发 布 镜像 的 打包 操作 , 尽管 如 此 ,往往 还 是 免不了 要 做 一 
些 人 工 调 整 一 一 一 键 打 包 什 么 的 就 别 想 了 ( 至少 暂 时 还 不 行 )。 出 于 这 个 原因 ， 人 们 又 开发 了 各 
种 用 于 辅助 打包 和 分 发 过 程 的 工具 。 不 过 在 这 一 半 中 ,我们 只 天 注 如 何 利用 OTP 目 号 提供 的 功能 
来 创建 和 安装 发 布 镜 像 包 。 


10.3.1 创建 发 布 镜像 包 


systools 另 有 一 个 专门 用 于 创建 发 布 镜像 包 的 功能 , 这 就 是 make_tar () 。 熟 悉 tar 的 话 就 能 猜 
到 ，make_tazr 的 作用 无 非 就 是 把 发 布 镜像 包 中 的 所 有 文件 合并 成 一 个 tarball。 
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什么 是 tarball 

tar 是 UNIX 系统 提供 的 一 个 通用 的 文件 归档 工具 。tar 和 zip 类 似 ， 但 它 不 会 对 文件 进行 
压缩 ， 它 只 会 把 文件 合并 到 一 起 形成 单个 称 为 tarball 的 文件 ,该 文件 更 易于 复制 , 也 便于 在 其 
他 位 置 解 包 。Tarball 文件 的 扩展 名 为 .tar。 

一 般 情 况 下 ， 还 会 用 gzip 工具 再 把 这 个 文件 压缩 一 遍 。 这 样 的 话 ， 最 终生 成 的 文件 的 扩 
展 名 将 是 .tar.gz 或 .tgz。 在 Windows 下 ,可 以 用 7-Zip 等 程序 来 创建 、 解 压 或 查看 tar 文 件 。Erlang 
stdlib 应 用 中 的 erl tar 模块 提供 了 对 tar 文 件 的 支持 。 


和 此 前 执行 systools:make_script/2 时 一 样 ， 必 须 先 根据 正确 的 应 用 路 径 打 开 一 个 
Erlang shell。 去 抒 local 选 项 后 再 执行 一 遍 make_script/2，, 便 可 创建 出 更 为 实用 且 位 置 无 天 的 局 
动 脚本 。 然 后 ， 以 发 布 镜像 文件 的 文件 名 《不 市 扩展 名 ) 为 参数 调用 make_tar/2: 


S erl -pa ./simple cache/ebin -pa ./resource discovery/ebin 





Eshell V5.7.4 (abort with ^GQ) 

1> systools:make script("simple cache", [|]). 
ok 
2> systools:make tar{"simple cache", [{erts, code:root dir{(})}]). 
Ok 


其 中 的 erts 选 项 表示 运行 时 系统 (ERTS ) 也 要 一 并 打包 在 内 , 这 样 创建 出 的 发 布 镜像 可 以 
在 任何 兼容 主机 上 安装 和 启 动 o ERTS 位 于 Erlang 安 装 日 录 的 根 日 孙 下 ( 0] 人 通过 code :root dir() 
定位 )， 在 本 例 中 ，ERTS 将 被 从 该 位 置 复制 出 来 。 如 末 不 将 ERTS 打 包 在 内 ， 就 必须 在 日 标 机 带 
上 单独 安 寂 ERTS 〈 或 者 全 套 Erlang/OTP 发 行 版 )， 而 且 必须 选用 与 发 布 镜像 包 的 需求 相 匹 配 的 
版 本 。 














附带 ERTS 会 加 深 发 布 镜 像 包 对 OS 的 依赖 性 

将 ERTS 纳入 发 布 镜像 包 ， 就 意味 着 ERTS 中 的 可 执行 文件 也 会 被 一 并 纳入 ， 而 这 些 可 执 
行文 件 只 能 在 与 自身 兼容 的 操作 系统 上 运行 。 例 如 32 位 Linux 上 的 可 执行 文件 是 无 法 在 64 位 
Linux 系统 上 运行 的 。 如 果 安 装 到 不 兼容 的 机 器 上 ， 局 动 系统 时 很 可 能 会 看 到 “erlexec: no such 
file or directory” 等 十 怪 的 错误 信息 。 


现在 检查 一 下 当前 目录 ， 你 会 发 现 一 个 新 的 名 为 simple_cache.targz 的 文件 。 这 便 是 经 过 压缩 
的 、 包 含 发 布 镜像 中 所 有 文件 的 tarball 文 件 。 


10.3.2 ”发 布 镜像 包 的 内 容 


-起 来 看 看 tarball 文 件 中 都 有 些 什 么 ， 可 以 说 OTP 中 最 重要 的 内 容 都 悉数 涵盖 在 内 了 。 在 类 
UNIX 系 统 上 ， 可 以 用 下 列 命令 进行 解压 ， 解 压 后 的 文件 位 于 名 为 tmp 的 新 目录 中 : 
$s mkQar tmp 


S cd tmp 
S tar -xzf ../simple cache.tar.gz 


如 有 果 手 头 没 有 tar 程 序 ， 也 可 以 在 Erlang shell 中 进行 解压 : 
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2> er] tar:extract ("simple cache.tar.gz", [{cwd, "tmp"}, compressed]). 

无 论 采用 哪 种 手段 , 最 终 你 都 将 得 到 以 下 目录 结构 (根据 所 安装 的 Erlang/OTP 的 版 本 的 不 同 ， 
此 处 列 出 的 应 用 版 本 号 也 可 能 会 有 所 不 同 ): 

tm 

erts-5.7.4 

| “一 bin 
|-- erl.src 





|-- kernel-2.13.2 
|-- mesia-4.4.10 


| a 

|-- resource discovery-0.1.cC 
| |-- ebin 

| | 

| `-— privy 

|-- sasl-2.1.5.3 
| 

| 

| 

| 


-— Simple cache-0.3.0 
|-- ebin 
| 
“一 一 priyvy 

“一 stdlib-1.16.2 

-—- releases 

|-- 0.1.0 

| |-- start.boot 

| “-- sys.config 

“一 一 simple cache.rel 


发 布 镜像 包 中 一 定 会 有 lib 和 releases 两 个 目录 。 此 外 , 由 于 在 调用 make_tar () 时 加 上 了 erts 
选项 ,目录 结构 中 还 会 存在 一 个 名 为 erts-<version> 的 顶层 目录 , 该 目录 下 还 有 一 个 名 为 bin 的 子 目 
录 ， 其 中 包含 运行 时 系统 中 的 所 有 可 执行 文件 。 请 特别 留意 其 中 的 一 个 名 为 erlsrc 的 文件 ， 这 是 
一 份 erl 启 动 脚本 的 模版 ( 用 于 类 UNIX 系 统 )。 在 安 疙 发 布 锐 像 时 ， 应 该 将 erl.src 复 制 到 erl 中 并 将 
该 文件 中 的 特殊 字符 串 sFINAL_ROOTDIR$S 蔡 换 成 日 标 系 统 上 的 真实 路 径 。 

发 布 镜像 所 需 的 所 有 应 用 都 包含 在 lib 目 录 下 。( 默认 情况 下 , 这 里 只 存放 应 用 的 ebin 和 priv 子 
目录 。) 请 注意 ， 应 用 目录 的 目录 名 是 包含 版 本 号 的 。 这 样 做 是 为 了 便于 安装 同一 应 用 (甚至 整 
个 发 布 镜像 ) 的 多 个 版 本 ， 进 而 实现 系统 的 动态 升级 同样 也 适用 于 升级 失败 后 的 回 深 。 

releases 目 录用 于 存放 与 发 布 镜像 相关 的 信息 。 除 ,rel 文件 以 外 ， 你 还 会 在 该 目录 下 找到 一 个 
以 发 布 镜像 版 本 号 命名 的 子 目 录 。 局 动 文件 (.boot 文 件 ) 和 sys.config 文 件 都 被 存放 在 内 ， 不 过 局 
动 文件 被 重 命 名 成 了 start.boot。 采 用 这 种 目录 结构 ， 安 装 在 同一 根 目录 下 的 多 个 发 布 镜像 将 可 以 
共享 这 些 文件 。 

Erlang/OTP 安 法 程 序 米 用 的 正 是 这 种 目录 结构 : 到 目 己 的 电脑 上 看 看 ，Erlang/OTP 系 统 安 法 
目录 下 的 结构 如 出 一 入 〈 不 过 还 会 多 出 一 些 文件 和 目录 )。 
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10.3.3 ”定制 发 布 镜像 包 


还 差 一 点 点 ， 发 布 镜 像 的 创建 过 程 就 介绍 完了 。 你 往往 还 会 需要 在 发 布 镜 像 包 中 加 些 东 西 ， 
而 这 些 事 情 systools :make_tar () 义 无 法 代为 完成 ,例如 ,通常 我 们 都 由 加 上 一 个 顶层 目录 bin， 
用 于 存放 系统 的 各 种 安装 脚本 和 启动 脚本 。 下 面 ， 我 们 就 在 tmp 下 创建 这 个 bin 目 录 ， 再 配 上 几 个 
工具 脚本 ( 以 下 假设 你 使 用 的 类 UNIX 操 作 系 统 )。 第 一 个 脚本 是 安装 时 用 的 ,用 于 在 发 布 镜像 安 
装 完毕 后 设置 根 目 录 ， 不 妨 管 它 叫 bin/install: 

#1/bin/sh 

ROOT= 、 pwad. 


DIR=. /erts-5.7.4/bin 
Seqd s:%FINAL ROOTDIR%®S: SROOT: S$DIR/erl.src > SDIR/erl 


请 根据 目 己 的 发 布 锐 像 适 当 调 整 ERTS 的 版 本 号 。 接 下 来 ， 青 添加 一 个 名 为 bin/simple_cache 
的 启动 脚本 。 脚 本 内 容 与 我 们 在 10.2.6 节 中 启动 系统 时 用 的 命令 行 类 似 : 
#1! /bin/sh 
. /erts-5.7.4/bin/erl \ 
-Sname cache 
-boot ./releases/0.1.0/start \ 


-config ./releases/0.1.0/sys 
-detached 


同样 ， 请 按 实际 情况 适当 调整 版 本 号 。 当 然 ， 别 忘 了 用 chmoa a+x ./bin/* 给 脚本 打上 可 
执行 标记 。 

最 后 还 有 一 件 事 , 根据 所 选 安装 方式 的 不 同 , 可 能 还 需要 修改 发 布 镜像 中 版 本 子 目 录 的 目录 
名 。OTP 中 的 工具 通常 会 做 如 下 假设 : 单个 目标 目录 下 只 会 朗 有 一 种 类 型 的 发 布 镜像 ， 并 且 目 标 
目录 一 般 都 以 发 布 镜像 的 名 称 命名 (譬如 /usrVlocalsimple cache ); 这 么 一 来 ， 就 没有 必要 在 版 本 
子 目录 的 目录 名 中 再 次 重复 这 个 名 罕 一 一 这 就 是 上 述 示例 中 releases 目 录 下 的 目录 名 是 0.1.0 的 原 
,但 是 , 如 果 你 打算 在 同一 目标 系统 中 创建 多 个 更 细 粒 度 的 发 布 镜 像 包 , 这 种 模式 就 不 合适 了 。 
这 时 ， 应 该 抛弃 Version 格 式 的 版 本 上 日 录 名 ， 转 而 采用 ReleaseName-Version 格 式 的 目录 名 ( 壁 如 ， 
将 releases/0.1.0 改 成 releases/simple_cache-0.1.0 ),。 这 样 一 来 , 各 个 发 布 镜像 中 的 应 用 便 可 以 独立 安 
装 升 级 ， 而 不 必 担 心目 录 会 重 名 了 。 

启动 脚本 中 的 路 径 也 要 同步 修改 。 同 时 ， 请 把 .rel 文 件 也 移动 或 复制 到 版 本 的 子 目 录 中 去 ， 
以 们 今后 在 该 目录 下 解压 新 版 本 的 发 布 锐 像 时 禾 盖 原始 文件 。 对 于 这 种 包 ， 就 没 必要 把 ERTS 也 
一 并 纳入 了 ， 只 要 再 创建 一 个 仅 含 ERTS 的 独立 安装 包 就 可 以 了 。 

等 调整 好 发 布 人 说 像 包 中 的 文件 ， 只 和 需 调用 erl_tar 模 块 再 次 生成 tarball 文 件 即 可 ， 如 下 所 示 
(假设 当前 目录 仍然 是 tmp 目 录 ): 


S_ cd tmp 
$ erl 




































































Eshell V5.7.4 (abort with ^G) 
1> erl tar:create("simple cache-0.3.0.tar.gz", ["erts-5.7.4", "lib", 
"releases", "bin"], [compressedl]). 


这 个 命令 执行 完毕 后 ，tmp 目 录 下 将 会 多 出 一 个 名 为 simple _ cache-0.3.0.targz 的 压缩 包 ， 你 杂 
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手打 造 的 发 布 镜像 便 栖身 于 此 。( 当然 , 乐意 的 话 你 也 可 以 用 tar 命 令 来 完成 打包 。) 全 功能 的 发 布 
镜像 包 承 此 新 鲜 出 炉 ， 赶 么 找 一 人 台 主 机 把 它 安 闻 区 当 ， 然 后 快 快 局 动 它 吧 。 


10.4 ”安装 发 布 镜 像 


OTP 通 过 SASL 的 release_handler 模 块 为 发 布 锐 像 的 解 包 、 安 安 和 升级 提供 支持 。 这 个 话 
懒 相 当 复 杂 ， 我 们 并 不 打算 在 此 做 深入 讨论 。 在 实际 应 用 中 ， 这 个 模块 的 使 用 频率 也 并 不 高 。 这 
套 方 法 无 法 应 对 安放 在 同一 目标 目录 下 的 多 套 发 布 镜像 ， 我 们 在 上 一 节 中 为 此 所 做 的 改动 与 
release_handler 的 工作 方式 不 兼容 。 在 此 ， 我 们 打算 另行 介绍 一 种 解 包 和 安 猴 发 布 镜像 的 方 
法 ， 这 种 方法 更 简单 也 更 健壮 。 

由 于 发 布 镜 像 包 已 经 将 ERTS 打 包 在 内 ， 随 便 找 台 兼 容 的 主机 ， 将 它 解压 到 任意 任 一 目录 下 
即 可 一 一 外 可 以 是 空 目 录 ， 也 可 以 是 先前 安 朔 的 目标 系统 所 在 的 目录 〈 用 于 升级 发 布 镜 像 )， 无 
须 事 匈 在 机 再 上 安 猴 Erlang/OTP。 下 一 步 是 解 包 。 在 类 UNIX 系 统 上 ， 可 以 用 tar; 此外， 无 论 用 
的 是 什么 操作 系统 ， 都 可 以 像 之 前 那样 调用 er1_tar: 


$s mkdir target 
































Ss erl 
Eshell V5.7.4 (abort with ^ 人 G) 
1> erl tar:extract ("simple cache-0.3.0.tar.gz", [{cwd, "target"},compressedl]). 


接着 ， 用 cd 进入 目标 目录 并 执行 先前 创建 的 bpin/install 脚 本 设置 好 根 路 径 。 摘 定之 后 ， 就 可 以 
用 bin/simple_cache 脚 本 启动 系统 了 (记得 至 少 先 启 动 一 个 联络 节点 ): 


S cd target 
$ ./bin/install 
S ./bin/simple cache 


请 注意 ,系统 是 单独 启动 的 , 而且 这 套 运 行 时 系统 仪 包 含 必要 的 应 用 。 所 以 Appmon 用 不 了 ， 
不 过 可 以 通过 联络 节点 来 启动 WebTool 版 的 Appmon( 参见 5.1.2 方 ), 然后 经 由 浏览 右 来 观察 系统 。 











自动 化 打包 安装 工具 

本 章 所 描述 的 过 程 中 ， 有 几 个 步骤 免不了 需要 人 工 参 与 。 为 了 解决 这 个 问题 ，Erlang 社区 
内 涌现 出 了 一 批 自 动 化 工具 , 基于 这 些 工 具 又 衍生 出 一 批 自动 化 的 打包 安装 方法 。 本 书 的 作者 
同时 也 是 其 中 两 套 工具 的 负责 人 ， 这 两 套 工具 都 可 以 从 http://erlware.org 获取 。 它 们 算 不 上 什 
么 标准 方案 ,当然 也 不 是 完成 这 类 任务 的 唯一 工具 。 虽 然 难 免 有 王 婆 卖 瓜 自 卖 自 夸 的 嫌疑 ， 但 
我 们 还 是 认为 有 必要 在 此 提 上 一 句 。 无论 是 用 我 们 的 自动 化 工具 还 是 用 别人 的 , 都 可 以 大 大 减 
轻 负 担 一 一 并 且 还 可 以 有 效 规 避 人 为 误 操作 的 风险 。 





10.5 小结 


OTP 发 布 打包 的 基本 情况 就 介绍 到 这 里 。 无论 是 运用 现 有 的 工具 还 是 根据 OTP 的 规范 去 打造 
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目 己 的 工具 , 这些 内 容 神 应 该 够 用 了 。 这 是 一 个 里 程 碑 一 一 要 知道 ,长 久 以 来 发 布 镜 像 都 被 视 作 
是 只 有 Erlang 完 知 才 有 能 力 把 控 的 暗黑 历法 。 

至 此 ,你 大 概 会 觉得 日 己 已 经 取得 真 经 ， 大功 告 成 了 吧 ? 模块 、 应 用 ,还 有 发 布 镜 像 ， 全 痢 
学 完了 。 还 有 什么 别 的 吗 ? 有 。 目标 系 统 的 作用 往往 需要 在 运行 时 通过 与 外 界 进行 交互 才能 得 以 
体现 , 其 中 不 乏 与 同一 台 机 右上 的 其 他 软件 之 间 的 通信 。 为 了 操控 硬件, 或 是 和 Eclipse 等 Java GUI 
进行 交互 ， 这 些 软件 可 能 会 用 C 或 Java 来 开发 。 这 类 交互 便 是 本 书 第 三 部 分 的 主题 。 
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集成 与 完善 





本 书 第 三 部 分 介绍 Erlang/OTP 应 用 如 何 与 外 界 集成 。 不 同 的 问题 需要 不 同 的 工具 来 解决 ， 
为 了 适应 异 构 生 产 环 境 下 的 开发 工作 ， 还 有 一 些 知识 需要 擎 握 。 在 这 一 部 分 ， 我 们 还 会 讨论 性 
能 问题 ， 从 而 最 大 限度 地 发 挥 出 Erlang/OTP 程序 的 威力 。 
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为 缓存 添加 HTTP 接 口 





本 章 概 要 

口 用 Erlang 开 发 高 效 的 TCP 服 务 融 

口 为 绥 存 应 用 添加 一 套 林 于 简易 文本 协议 的 TCP 接 口 
口 创建 自 定义 OTP 行 为 模式 

口 开发 一 个 基本 的 Web 服 务 妖 

口 为 绥 存 应 用 添加 一 套 REST 式 HTTP 接 口 














在 先前 章 方 中 , 我 们 实现 了 一 侠 顾 有 党 点 的 绥 存 应 用 。Erlware 团 队 计 划 在 接 下 来 的 几 个 月 中 
继续 对 它 加 以 完善 。 他 们 意识 到 Simple Cache 应 用 同样 适用 于 Erlware 之 外 的 项 目 。 然 而 该 应 用 
目前 只 有 Erlang 接 口 ， 因 而 也 只 能 用 于 用 Erlang 开 发 的 应 用 。 这 成 了 进一步 推广 Simple Cache 的 绊 
脚 石 。 

现 如 今 ， 生 产 环境 中 的 服务 往往 由 多 种 语言 写成 。 在 将 Simple Cache 开 源 之 前 ， 最 好 能 让 其 
他 语言 实现 的 系统 也 能 至 受到 它 市 来 的 便利 。 按照 这 个 思路 ,最 目 然 不 过 的 办 法 就 是 实现 一 套 或 
右 干 套 基 于 稍 见 网 络 协议 的 接口 。 在 这 一 章 中 , 我 们 先 为 你 安排 了 一 个 热 号 练习 ， 实 现 一 套 基于 
TCP 的 文本 协议 ; 然后 ， 你 将 自行 开发 一 套 简 化 的 Web 服 务 器 ， 再 经 由 该 服务 需 为 Simple Cache 
提供 一 套 REST 式 接口 ! 在 这 一 过 程 中 ， 你 将 习 得 从 高 级 监督 策略 到 目 定 义 行为 模式 ， 力 至 OTP 
内 建 HITP 协 议 解 析 函 数 的 使 用 等 一 系列 实用 编程 技巧 。 

在 本 草 的 第 一 部 分 中 ,你 将 学 习 如 何 编写 高 效 的 并 发 TCP 服 务 硕 应 用 ,并 为 缓存 应 用 实现 一 
套 伽 单 的 文本 协议 接口 。 第 二 部 分 站 先是 一 段 针 对 HTTP 协 议和 REST 概 念 的 粗浅 介绍 , 然后 开始 
学 习 自 定义 行为 模式 的 创建 ， 并 实现 一 套 基本 的 Web 服 务 咒 ， 进 而 以 此 为 基础 为 缓存 应 用 搭建 一 
套 REST 式 接口 。 

本 间 就 此 拉 开 帷 秦 ， 我 们 先 来 简短 讨论 一 下 基于 文本 的 通信 协议 以 及 如 何在 Erlang 中 高 效 运 
用 TCP 套 接 字 。 
































11.1 实现 TCP 服务 器 
纯 文 本 是 一 种 通用 载体 。 以 纯 文本 为 基础 的 协议 不 仅 实现 人 简单， 而且 易 于 使 用 和 调试 。 为 了 
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给 缓存 应 用 打造 一 僚 恨 好 的 TCP/P 接 口 , 我 们 不 妨 先 来 实现 一 套 基本 的 文本 协议 , 这 套 协 议 应 当 
尽量 地 简单 和 直观 。 你 会 发 现 这 套 协议 的 服务 天 与 你 在 第 3 草 中 编 与 的 RPC 服 务 带 项 为 类 侯 ， 但 
二 者 之 间 存 在 一 个 重要 区 别 : 此 前 的 RPC 服 务 大 只 能 处 理 单 个 TCP 连 接 。 而 在 这 一 革 中 ， 你 将 要 
创建 的 是 一 套 具备 工业 强度 的 服务 角 ， 这 类 服务 硕 的 创建 是 每 个 合格 的 Erlang 程 序 员 都 应 当 和 擎 握 
的 必 备 技能 。 仰 仗 于 Erlang 内 建 的 并 发 文 持 能 力 , 这 套 服务 融 将 可 以 轻松 应 对 大 量 并 发 TCP 连 接 。 























11.1.1 高效 TCP 服 务 器 的 设计 模式 


对 于 需要 并 发 处 理 多 个 请 求 的 服务 器 ,有 一 种 有 效 的 设计 模式 , 那 就 是 将 服务 大 实现 成 由 人 简 
易 一 对 一 ( simple-one-for-one ) 监督 者 管理 的 gen_server。 在 6.3.4 节 中 我 们 曾经 做 过 介绍 ， 徐 
易 一 对 一 监督 者 的 子 进程 都 是 动态 创建 的 ， 而 且 这 些 子 进程 还 必须 同属 一 种 类 型 。 在 本 例 中 ,， 服 
务 需 会 在 启动 之 初创 建 一 个 gen_server 子 进程 ， 它 将 扮演 TCP 连 接 处 理 融 的 角色 一 一 这 个 进程 一 
启动 便 阻 塞 执 行 gen_tcp:accept/1， 开 始 监听 新 连接 。 建 立新 连接 之 后 ， 这 个 gen_servez 会 
让 监督 者 另行 创建 一 个 新 的 处 理 需 进程 , 自己 则 转 而 为 当前 连接 服务 。 新 创建 的 进程 实际 上 就 是 
先前 那个 gen_server 进 程 的 克隆 ， 监 听 新 连接 的 任务 将 由 它 担负 。 

在 这 个 模式 下 ， 接 受 新 连接 的 时 候 accept 和 后 续 的 连接 处 理 之 间 几 乎 没有 任何 延迟 ; 从 上 
一 个 连接 接受 完毕 到 准备 好 接受 下 一 个 连接 , 期 间 的 延 色 也 得 以 最 小 化 。 这 个 思路 与 其 他 编程 语 
言 中 套 接 字 的 典型 用 法 大 相 径 庭 ， 但 却 是 最 具 Erlang 特 色 的 做 法 。 图 11-1 便 是 这 个 设计 中 的 通信 
流程 及 控制 流程 。 






































1. 监督 者 创建 出 
一 个 旋 De 
处理 妖 简易 一 对 


2. 处 理 器 接受 一 监督 者 


PP gen_ Server 









二 一 3. 处 理 器 请 求 创建 
4. 处 理 器 开始 新 的 处 理 器 5. 监督 者 派生 出 





处 理 连接 新 的 处 理 器 


EN EE EE 国 | = 
gen_ Server 
6. 新 处 理 器 等 待 
下 一 个 连接 


7. 循环 往复 a 


v 
图 11-1 用 简易 一 对 一 监督 者 实现 高 并 发 TCP 服 务 器 。 监 督 者 会 派生 出 多 个 子 进程 ， 








每 个 子 进程 各 自负 责 一 个 新 TCP 连 接 , 全 程 掌管 从 accept 到 后 续 客 户 端 通信 
的 全 部 处 理 
看 起 来 挺 复杂 , 但 很 快 你 便 会 发 现 , 用 不 了 多 少 代码 便 能 实现 基本 框 染 。( 在 Erlang 中 这 是 党 
有 的 事 儿 。) 你 应 该 想得到 ， 要 想 搭建 新 的 TCP 服 务 融 ， 还 得 先 创建 一 个 OTP 应 用 。 
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11.1.2 ”搭建 tcp_interface 应 用 的 骨架 


Simple Cache 可 以 有 多 套 外 部 接口 ， 这 套 TCP 文 本 接口 不 过 是 其 中 的 一 个 而 已 。 为 此 ， 我 们 
将 它 实 现 为 一 套 单独 的 OTP 应 用 。 要 是 打算 再 添置 一 套 接口 , 譬如 UDP 文本 接口 或 是 本 章 后 续 的 
HTTP 接 口 ， 也 请 遵循 这 一 模式 ， 以 免 对 现 有 代码 产生 干扰 。 在 制作 发 布 镜像 (参见 第 10 章 ) 时 ， 
根据 应 用 场景 的 不 同 ， 可 以 选择 包含 一 套 或 春 干 套 接口 ， 也 可 以 一 套 都 不 要 。 

现 如 今 ， 想 必 你 已 经 很 熟悉 OTP 应 用 的 创建 步骤 了 (如 有 需要 ， 请 参阅 第 4 章 )。 和 其 他 应 用 
一 样 ，tcp_interface 应 用 中 有 一 个 .app 文 件 ， 一 个 应 用 行为 模式 实现 模块 全 app， 以 及 一 个 顶层 监 
督 者 模块 ti_sup。 
































过 度 简 化 的 监督 结构 
出 于 简化 代码 的 目的 ， 此 处 我 们 采用 上 一 节 中 提 到 的 简易 一 对 一 监督 者 作为 顶层 监督 者 。 
不 过 在 实际 应 用 中 ， 在 这 层 之 上 一 般 还 需要 一 层 监 督 结构 ， 正 如 第 9 章 中 位 于 sc_element sup 
之 上 的 sc_ sup。11.2 节 中 的 HTTP 接口 将 会 采用 更 为 稳固 的 监督 结构 。 
除了 上 述 内 容 , 要 实现 图 11-1 中 基于 gen server 的 处 理 带 进程 ,还 需要 一 个 模块 ,这 就 是 fi server。 
这 些 文件 就 位 之 后 ， 应 用 的 目录 结构 应 当 如 下 所 示 (平行 于 simple_cache 和 和 resource_discovery 
应 用 所 在 的 目录 ): 


tcp interface 





|-- ebin 
| `-- tcp interface.ape 
“一 一 src 

| -=- ti _app.erl 

| -=- ti_sup.erl 

“一 一 ti server.erl 


在 本 章 接 下 来 的 内 容 中 , 我 们 将 市 你 逐一 实现 这 些 模块 的 功能 ， 事 无 巨细 ， 无 一 遗漏 。 这 一 
设计 背后 的 简单 、 优 雅 、 高 效 都 将 得 到 淋 演 尽 致 的 体现 。 在 此 期 间 我 们 将 用 到 一 些 技 巧 ， 某 些 地 
方 还 会 有 些 难度 ， 不 过 等 到 本 章 结 束 时 它们 就 痢 不 成 问题 了 。 











11.1.3 ”填充 TCP 服 务 器 的 实现 逻辑 


我 们 将 在 11.2.1 节 中 解释 ， 要 想 接 受 TCP 连 接 ， 必 须 先 创建 监听 套 接 字 。 而 且 ， 持 有 监听 套 
接 字 的 进程 在 TCP 服 务 需 的 整个 生命 周期 内 都 必须 活着 ; 该 进程 一 旦 终止 ， 监 听 套 接 字 也 将 上 自动 
随 之 关闭 。 这 样 的 话 ， 除 非 再 次 创建 新 的 监听 套 接 字 【〈 璧 如 重 局 应 用 )， 否 则 服务 器 就 无 法 接受 
新 的 连接 了 。 

1.ti_ app 模块 

那么 在 哪里 打开 监听 套 接 字 才 好 呢 ? 根据 OTP 的 设计 原则 ， 监 督 模块 中 的 代码 应 当 尽 量 精 
简 ; 既然 如 此 ， 不 妨 放 在 负责 应 用 局 动 逻辑 的 ft_app 模 块 中 。 打 开 的 监听 套 接 字 可 以 经 由 此 处 传 
递 给 简易 一 对 一 监督 者 f_sup， 进 而 再 扩散 至 新 创建 出 来 的 各 个 处 理 需 进程 。 

处 理 完 监 督 者 的 初始 化 之 后 ，ti_app 模 块 还 必须 按 图 11-1 的 指示 创建 出 首 个 连接 处 理 古 。 代 
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码 清单 11-1 便 是 ti_app:start/2 的 实现 。 
代码 清单 11-1 ti app 模 块 


-module (ti app). 

-behaviour (application). 
-export([start/2, stop/1]). 
-define (DEFAULT_ PORT, 1155). 


Startl Startiyvoe,. Startnrgs) =% 0 获取 端口 号 
Port = case application:get_env ltcp_ interface, port) of 
{ok, P} -> P;: 
undefined -> ?DEFAULT PORT 
las 9 创建 监听 套 接 字 
{ok, LSock} = gen tcp:listen(Port, [{active, true}l])}), 
Case ti sup:start link(LSock) of 
{ok, Pid} -> 


ti_ sup:start child!(), 
ak,. Dig): 0 派生 第 一 个 处 理 器 


Other -> 
{error, Other} 
end. 


stop( State} 一 > 
OK. 


模块 首先 在 应 用 配置 中 查找 服务 器 的 监听 端口 号 @ (参见 10.2.5 节 )。 如 果 没 有 指定 端口 号 ， 
则 采用 默认 值 1155。 紧 接着 便 是 监听 套 接 字 的 创建 @。 然后 , 模块 将 以 监听 套 接 字 为 输入 参数 启 
动 监督 者 。 等 到 监督 者 运行 起 来 之 后 , 再 调用 ti_sup :start_child() 作 创建 出 第 一 个 ti_server 
进程 ， 该 进程 将 默默 等 待 第 一 个 连接 的 到 来 (图 11-1 )。 

2. ti_sup 模 块 

ti_sup 模 块 与 第 6 章 中 的 sc_sup 模 块 颇 为 类 似 ， 都 是 简易 一 对 一 监督 者 。 二 者 之 间 的 主要 区 别 
在 于 遇 数 的 参数 个 数 : sce_sup( 后 来 更 名 为 sc_element sup ) 中 的 start_1ink 国 数 没 有 参数 ， 
start_childq 则 有 两 个 参数 。 本 例 中 的 start_1ink 以 监听 套 接 字 为 参数 , 启动 新 子 进程 时 则 无 
须 任 何 参数 。ti_sup.erl 的 完整 源码 如 代码 清单 11-2 所 示 。 


代码 清单 11-2 ”ti_sup 模 块 


-modGdule{(t1i sup). 























-behaviour (supervisor). 


名 名 API 
-export([start link/1l, start child/0]). 


SS Supervisor callbacks 
-export ([init/1]). 


-define (SERVER, ?MODULE). 


start_link{({LSock) -> 
supervisor:start_ link({local, ?SERVER}, ?MODULE, [LSock])}). 
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start_ child{(} -> 
supervisor:start child(?SERVER, [1). 将 套 接 字 传 入 
init([LSock]} -> 监督 者 的 init 回 调 
Server = {ti_ server, {ti_ server, start Jink, [LSock]}, 
temporary, brutal_kill, worker, [ti_server]}, 子 进程 规范 中 
Children = [Server], 用 到 了 套 接 字 
RestartSstrategy = {simple_one_ for_one, 0, 1}, 


{ok, {RestartStrategy, Children}}. 

Start Li1ink/1 也 数 以 监听 套 接 字 为 参数 并 将 之 传递 给 supervisor:start link/3, 进 
而 最 终 传递 至 该 模块 自身 的 init /1 回调 全。 本 例 中 的 start_chi1g/0 限 数 很 简单 ， 无非 就 是 让 
监督 者 按照 init/1L 中 的 子 进程 规范 另行 创建 一 个 子 进 程 。 传 人 init/1 回 调 的 监听 套 接 字 被 写 进 
了 子 进程 规范 人 @, 这 样 它 便 会 成 为 所 有 新 子 进 程 的 启动 参数 。 这 个 简短 的 模块 实际 上 就 是 一 个 既 
精巧 又 符合 OTP 规 范 的 进程 工 片 ， 专 门 用 于 创建 负责 处 理 外 来 连接 的 fi_server 进 程 。 

3.ti server 模 块 

fi_server 模 块 就 是 连接 处 理 硕 ， 它 负责 从 监听 套 接 字 处 接受 新 连接 ， 并 给 它们 分 配 专用 的 套 
接 字 ， 从 而 与 客户 端 建 立 TCP 通 信 。 如 网 11-1 所 示 ， 在 设计 该 模块 时 ， 我 们 采取 的 策略 是 让 简易 
一 对 一 监督 者 持 有 监听 套 接 字 , 并 将 之 传递 给 它 创建 出 来 的 所 有 处 理 喜 进程 。 监 听 新 连接 的 任务 
总 是 交 由 最 新 创建 的 处 理 需 负责 。 一 有 连接 接 和 人 , 它 就 会 让 监督 者 再 局 动 一 个 新 的 处 理 需 并 将 监 
听任 务 移交 过 去 ,然后 便 转 而 着 手 处 理 日 己 刚刚 接受 的 新 连接 。 一 旦 走 至 这 一 步 ， 处 理 带 就 青 也 
不 会 恢复 到 监听 状态 了 ; 从 此 人 往 后 , 它 将 一 耳 人 负责 这 一 连接 上 的 会 话 处 理 , 并 最 终 随 会 话 的 结 
而 终止 。ti_server 的 初始 版 本 如 代码 清单 11-3 所 示 。 


代码 清单 11-3 ”基本 的 ti_server 模 块 


-module{ti server). 





























-behaviour (gen server). 





-export([start Jink/1])}. 


-export([init/1, handle call/3, handle cast/2, handle_ info/2, 
terminate/2, code change/3]). 


-recordlstate, {lsock}). 


start link (LSock}) -> 
gen_ server:start_link(?MODULE, [LSock], [1]). 





init{({[LSock]}) -> 


{ok, #state{flsock = LSock}, 0}. 
JJ 夕 圭 刀 cy 殖 下 
handle cal11(Msg，_RFRrom， State) 一 > @ 将 超时 置 


{reply, {ok, Msg}, State}. 


handle cast(stop, State) -> 
{stop, normal, State}. 


handle_infol({tcp, Socket, RawData}, State}) -> 
NewState = handle datalSocket, RawData, State), 


{noreply, Newstate}; 8 处 理 收 到 的 数据 
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handle_info{{tcp closed, _Socket}, State) -> 
{stop, normal, State}: 
handle info(ttimeout, #state{lsock = LSock} = State}) 一 > 
iok, _Sock} = gen tcp:accept (LSock), 二 了 后 大 至 此 处 
ti_sup:start_child()}, 
{noreply, State}. 


terminate!{ Reason, _State) -> 
ok. 

code change{ OldVvesn, State, Extra) 一 > 
{ok, State}. 


%S% Internal functions 





车 斤 昌 ~ 久米 立 
Danale_ aatal(SocKet ， 有 RawData， State) -> (暂时 ) 将 数据 从 套 接 字 
gen_tcp:send(lSocket, RawData}), 原样 返回 
State. 


start_1ink/1 羡 数 就 是 监督 者 启动 处 理 需 进程 并 辐 新 进程 传人 监听 套 接 字 的 地 方 。 随 后 ， 
监听 套 接 宇 又 经 由 gen server:start link/3 传 至 gen server 的 1riit/1 回调 他 。 ijnit/1 回 调 
负责 把 套 接 字 存 人 服务 各 状态 记录 ， 在 返回 的 同时 它 还 会 将 超时 置 雪 ， 以 免 阻 塞 init/1 的 调用 
者 ， 我 们 曾经 在 第 3 草 中 用 过 这 个 手法 〈 参 见 代码 清单 3-4 和 代码 清单 3-5$ )。 将 超时 置 零 可 以 令 新 
创建 的 gen_server 进 程 的 执行 流程 立刻 落 入 handle_info/2 的 timeout 子 句 登 。 

至 中， 处 理 需 进程 终于 摆脱 了 ti _server:start link/1 的 调用 进程 ( gti sup 监督 者 进 
程 )， 与 早先 启动 又 尚未 终止 的 其 他 进程 并 行 运行 了 起 来 。 紧 接着 ， 这 个 处 理 带 进程 会 立即 在 监 
上 听 套 接 字 上 调用 gen_tcp :accept/1， 阻 塞 等 符 下 一 个 TICP 连 接 的 到 来 。( 请 务必 确保 此 时 没有 
别 的 进程 在 等 待 该 处 理 硕 进程 ， 否 则 它们 也 会 因为 这 个 阻塞 调用 而 被 挂 起 。) 

等 到 accept () 返回 时 (返回 时 机 视 服务 硕 的 负载 高 低 而 定 ， 有 可 能 很 快 ， 也 有 可 能 由 于 接 
口 基本 没 人 用 而 要 等 上 好 几 个 月 ), 首先 便 是 调用 ti_sup:start_child() 让 监督 者 再 启动 一 个 
处 理 需 。 新 的 处 理 需 进程 本 身 是 当前 进程 的 一 个 克隆 , 它 会 立刻 接 过 监听 新 连接 的 接力 棒 , 同时 ， 
当前 处 理 需 进程 转 而 继续 处 理 刚 刚 接 有 党 的 连接 。 

由 于 我 们 在 打开 监听 套 接 字 时 采用 的 是 主动 模式 〈 代 人 码 清单 11-1 )， 而 且 accept () 返 回 的 连 
接 专 用 僚 接 字 会 继承 该 属性 , 因此 经 由 这 些 专 用 和 套 接 字 传 人 的 所 有 外 来 数据 首先 都 会 被 转换 成 一 
条 {tcp，Socket，RawDatal 格 式 的 消息 ， 然 后 再 被 自动 发 送 至 对 应 的 处 理 器 进程 @, 个 中 细 
节 我 们 曾经 在 第 3 章 中 做 过 介绍 。 当 前 版 本 的 fi_server 只 会 将 外 来 数据 经 由 TCP 连 接 简 单 回 传 给 客 
户 端 人 @, 最 后 , 还 需要 人 处理 套 接 字 上 的 tcp_closed 消 息 ， 从 而 确保 ti_server 进 程 能 够 随 套 接 
字 的 关闭 而 终止 。 

细节 还 真是 多 啊 ， 不 过 物 有 所 值 ， 现 在 你 已 经 拥有 了 一 套 通 用 的 TCP 服 务 硕 框 妨 ， 只 需 加 以 
调配 便 可 适用 于 多 种 不 同 场景 。 以 Simple Cache 接 口 为 例 ， 只 需 对 服务 大 的 协议 人 处理 部 分 进行 扩 
展 便 可 。 我 们 将 在 下 一 市 讨论 这 些 内 容 。 






























































11.1.4 简单 文本 协议 
本 章 的 目的 在 于 为 Simple Cache 应 用 提供 更 为 丰富 的 对 外 接口 。 这 样 一 来 ， 无 论 采 用 的 是 何 
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种 编程 语言 (甚至 无 论 身 处 网 络 中 的 哪 台 机 硕 ), 任何 人 都 可 以 通过 TCP 与 Simple Cache 应 用 进行 
交互 。 和 截至 目前 为 止 ， 你 已 经 有 了 一 父 沿 不 具备 任何 实际 功用 的 TCP 服 务 硕 框 氏 。 现 在 ， 我 们 将 
以 这 套 框架 为 基础 来 实现 一 套 简 单 的 文本 协议 。 

我 们 曾 在 第 6 草 中 做 过 介绍 ，simple_cache 的 API 模 块 有 3 个 导出 因数 : insert/2、lookup/1 
和 delete/1 (代码 清单 6-7 )。 它 们 便 是 TCP 接 口 所 要 提供 的 功能 。 

外 界 在 调用 Simple Cache 时 ， 和 采用 的 协议 可 以 表述 为 以 下 请 法， 其 中 | 表示 选择 ，Term 表 示 
Erlang 项 式 常 量 : 


Call -> Function ArgLigst 











Function -> "insert" | "lookup" | "delete" 
ArFOgList < TI *] | TY Terms 站] 
Terms -> Term | Term "," Terms 
举 个 例子 : 
insertleric, {"Eric", "Merritt"}: 





lookup[eric] 
男 一 方面 ， 与 每 个 请 求 相对 应 的 应 答 的 格式 如 下 : 

Result -> "OK:" Term ".\n'" | "ERROR:'" Term ".\n' 
也 就 是 一 个 以 “OK:” 或 “ERROR:” 为 前 级 、 以 句点 加 换行 符 为 结尾 的 项 式 。 例 如 ， 如 果 发 送 
请 求 "1ookup [eric]"， 可 能 会 得 到 以 下 应 答 

OK: {"Eric","Merritt"}. 
而 当 消 息 内 容 为 "Qex#s$^1gs" 时 ， 啊 应 将 会 是 : 

ERROR:bad request 

insert 操 作 应 该 有 两 个 参数 , 分 别 是 键 和 对 应 的 值 。 lookup 和 delete 操 作 则 只 需要 键 作为 
唯一 参数 。 请 注意 键 和 值 都 可 以 是 任意 Erlang 项 式 。 

这 套 协议 使 用 方便 ,解析 简单 。 经 过 调配 ,也 可 以 很 容易 地 与 其 他 类 似 的 服务 器 配合 使 用 。 
这 是 一 套 简 单 的 请 求 /响应 式 协 议 ， 尊 循 协 议 规范 的 客户 端 每 次 只 会 发 送 一 个 请 求 ， 发 完 之 后 便 
坐等 应 答 。 这 种 模式 可 以 有 效 控 制 每 个 连接 处 理 需 上 的 请 求 速 率 ， 从 而 将 流量 维持 在 可 控 范 围 
以 内 。 

客户 端 和 服务 天 之 间 的 消息 格式 已 经 定义 完毕 ， 可 以 开始 实现 请 求 的 解析 和 处 理 逻 辑 了 。 


























11.1.5 文本 接口 实现 


实现 这 和 套 简 单 文本 接口 ， 需 要 修改 fserver 模 块 中 的 handle_data/3 困 数 〈 人 参见 代码 清单 
11-3 )。 这 份 实现 中 的 TCP 套 接 字 是 以 主动 模式 创建 的 , 经 由 套 接 字 接收 的 文本 全 都 会 被 转换 为 消 
上 县, 并 目 动 投递 给 持 有 套 接 字 的 进程 一 一 也 惑 是 接受 连接 的 那个 处 理 融 进程。 这 些 消 息 将 被 传递 
给 负 责 协 以 实现 的 gen_servez :handle_info/2 回 调 浮 数 。 为 了 令 代 人 码 更 规整 ， 我 们 将 消息 处 
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理 的 部 分 全 部 挪 入 了 内 部 函数 hanale_dqata/3， 此 前 这 个 函数 只 是 将 收 到 的 数据 通过 TCP 套 接 
字 悉 数 奉 还 给 客户 问 ， 不 做 任何 处 理 。 

新 的 代码 需要 完成 以 下 步骤 : 

(1) 解析 接收 到 的 文本 行 ; 

(2) 将 文本 行 转 译 为 协议 中 的 3 个 郴 数 之 一 ; 

(3) 执行 请 求 中 的 操作 ; 

(4) 回 客 户 端 输出 结果 。 

上 述 步骤 可 由 以 下 代码 完成 。 这 段 代 码 与 第 3 章 中 的 对 应 代码 (代码 清单 3-6 ) 很 类 似 。 


代码 清单 11-4 ”在 ti server 中 实现 简单 的 基于 文本 的 协议 
handle data{lSocket, RawData, State) 一 > 
try 
{FUuNnction, RawArgList} = 
lists:splitwith(fun (C) -> C =/= $s[ end, RawData), 


{ok, Toks, _Line} = erl] scan:string (RawArgLigst ++ ".*, 1]), 

{ok, ArgS} = er parse:parse term({({Toks), 

Result = applylsimple cache, ligst to atom(Function}, Args), 

Gen tcp:send(Socket, io_ lib:fwrite("ORK:~p.~n", [Result])})) 
catch 

_Class:Err 一 > 

gen tcpigsemnaQd(Socketr，10 Jib:fwrite ("ERROR:~p.~n’", [Err])) 

end, 
State. 








实际 开发 中 应 该 将 该 函数 进一步 拆 分 成 硅 干 个 辅助 也 数 。 但 现在 为 了 便于 讲解 , 不 妨 暂 旦 将 
它们 揉 为 一 体 。( 请 注意 ， 在 实现 这 套 人 简单 协议 时 我 们 无 须 对 服务 硕 状 态 做 任何 修改 ， 因 此 在 也 
数 的 末尾 处 只 需 原 封 不 动 地 返回 State 变 量 。) 

第 一 步 ， 以 字符 [为 边界 切 分 接收 到 的 字符 串 。 如 采 输 入 中 的 确 包 含 [， 则 将 之 视 作 
RawArgList 部 分 的 第 一 个 字符 ; 否则 ，RawArgList 为 空 (这 将 导致 后 续 解 析 的 失败 )。 变 量 
Function 中 应 该 是 水 数 名 一 一 也 就 是 字符 [ 左 侧 的 全 部 内 容 。 

(根据 上 一 节 中 定义 的 协议 来 看 ) 字符 串 中 RawargList 的 那 半 段 看 起 来 和 普通 Erlang 列 表 一 
般 无 二 。 这 意味 春 可 以 直接 将 它 传 给 Erlang 的 词法 分 析 怖 erl scan (需要 预先 补 上 一 个 句点 )， 进 
而 生成 一 张 语 元 列表 。 将 语 元 列表 传 给 Erlang 的 解析 需 erl parse， 便 可 以 解析 出 一 张 实际 参数 列 
表 ， 这 张 列表 目 吴 也 是 一 个 Erlang 项 式 。 接 下 来 就 简单 了 ， 用 内 建 油 数 ( BIF ) apply/3 动 态 调 
用 simple_cache 柑 块 中 的 具名 隆 数 即 可 。 最 后 ,通过 TCP 僚 接 字 回 传 结果 ， 以 便 客户 痕 谈 取 。 

整个 过 程 中 很 多 环节 都 有 可 能 出 错 , 我 们 采用 try/catch 表 达 式 来 对 付 这 些 错 误 , 并 把 错误 
信息 打印 到 TCP 码 接 学 中 去 。 例 如 ， 当 词法 分 析 或 语法 解析 失败 时 ， 运 行 时 环境 会 因 哨 数 返 回 结 
果 与 {ok,...} 不 匹配 而 抛 出 异常 ; 如 果 无 法 正常 调用 绥 存 应 用 中 的 函数 〈 比如 上 枉 数 名 不 正确 或 
根本 就 是 个 空 字符 串 )， 又 会 抛 出 别 的 异 帝 。 

以 上 便 是 整个 应 用 的 完整 实现 Simple Cache 的 TCP 接 口 终 于 大 功 告 成 了 1 也 许 你 会 有 点 
儿 和 失望 , 心 想 :“ 这 就 完了 ， 就 这 人 么 一 段 小 程序 !” 可 别 筷 了 了 ， 你 所 实现 的 可 是 一 套 足 以 轻松 抵御 
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数 万 并 发 连接 的 框架 ， 而 且 你 还 可 以 随意 对 它 进 行 扩 展 ， 构 建 自 己 的 工业 级 强度 的 TCP 服 务 硕 。 

现在 ， 不 妨 局 动 一 余 simple cache 系统 来 试 试 这 套 接口 ， 步 又 和 上 一 章 中 一 样 ， 在 shell 中 调 
用 application:start(tcp_interface) 妈 可， 不 过 别 忘 了 在 路 径 中 加 上 tcp interface/ebin。 
(另外 ,在 启动 应 用 之 前 请 务必 先 准 备 好 ebin/tcp_interface.app 文 件 。) 调用 appmon:start() 确认 
所 有 应 用 都 已 经 局 动 。 等 缓存 和 TCP 接 口 都 跑 起 来 之 后 ， 可 以 按照 第 3 半 介 绍 的 办 法 ， 用 Telnet 
连 入 系统 ， 然 后 输入 11.1.4 节 中 定义 的 命令 。 

还 可 以 答 试 一 些 会 让 第 3 章 中 的 服务 天 一 筹 莫 展 的 举动 : 利用 两 个 或 更 多 Telnet 会 话 发 起 多 个 
并 发 连接 〈 比 如 从 一 个 会 话 上 写 人 数据 再 从 另 一 个 会 话 上 旋 出 来 ) 你 给 缓存 应 用 加 过 日 志 ， 
此 在 通过 TCP 恋 写 数 据 时 应 该 能 从 Erlang 终 端 上 看 到 一 些 状态 消息 ; 但 要 是 想 观 察 TCP 服 务 病 进 
程 内 部 的 动静 ， 那 就 必须 给 ti_server 加 日 志 了 。 最 后 ， 如 果 想 让 tcp_interface 应 用 作为 系统 的 一 部 
分 与 系统 一 同 启 动 ， 还 可 以 把 它 写 入 发 布 镜像 规范 ( 参见 第 10 章 )。 这 个 任务 就 留 给 你 了 。 

这 段 小 小 的 热身 运动 就 此 告 一 段落 , 我 们 该 进入 本 章 的 第 二 部 分 了 。 这 一 部 分 中 的 目标 更 为 
雄心 驼 勃 : 我 们 将 要 实现 一 套 REST 式 HTTP 接 口 ， 这 套 接 口 足以 水 载 出 和 人 Simple Cache 的 任何 载 
倍 ， 并 令 绥 存 应 用 得 以 与 任意 REST 式 服务 基础 架构 相 整 合 。 


11.2 ”打造 一 套 全 新 的 Web 接口 


目 打 本 草 一 开始 的 时 候 我 们 束 说 过 ， 在 给 缓存 应 用 评 加 HTITP 接 口 时 ， 我 们 不 但 要 以 HITP 
为 基础 来 设计 一 套 协 议 ， 还 要 搭建 一 套用 于 承载 这 套 接口 的 真正 的 HTTP 服务器。 你 可 能 会 党 得 
这 根本 就 是 重度 NIH 综 合 征 " 的 症状 嘛 ! 但 这 样 做 是 有 原因 的 。 我 们 的 目的 有 两 个 : 首先 ， 是 要 
给 出 一 个 示例 ， 它 将 为 你 展现 一 套 完整 而 健壮 的 实用 TCP 服 务 器 ， 顺 便 还 会 再 讲解 一 些 HTTP 服 
务 嚣 和 REST 的 相关 知识 (很 快 你 便 会 发 现 ， 用 Erlang 来 搭建 Web 服 务 器 简直 是 小 菜 一 碟 儿 ); 其 
次 ， 我 们 还 要 教 你 如 何 编 写 目 定义 的 OTP 行 为 模式 一 一 这 里 说 的 是 将 要 用 于 实现 HTTP 接 口 的 
gen_web_servet 行 为 模式 。 不 过 在 那 之 前 ， 我 们 还 是 先 对 HTTP 目 身 做 一 个 了 解 吧 。 



































11.2.1 HTTP 简介 


这 本 书 不 是 讲 HTTP 的 ， 所 以 我 们 不 会 浪费 精力 去 讲解 协议 细 方 ， 更 不 打算 介绍 如 何 实 现 完 
整 的 HTTP 服 务 硕 。 在 这 一 市 中 ,我 们 会 从 HTTP 协 议 中 挑选 寿 十 最 为 关键 的 内 容 进 行 介绍 。 在 用 
Erlang 给 Simple Cache 实 现 高 效 的 REST 式 接口 时 ， 有 这 些 知 识 就 够 用 了 。 

为 了 让 你 亲身 体验 一 下 HTTP, 我 们 将 会 用 上 两 个 UNIX 工 具 。 第 一 个 工具 是 用 于 观察 TCP 流 
量 的 nc (netcat )。 利 用 它 可 以 自行 建立 监听 套 接 字 ， 并 对 发 往 该 套 接 字 的 所 有 数据 进行 观测 。 第 
二 个 工具 是 curl， 这 是 一 个 命令 行 HITP 客 户 疹 ， 可 以 利用 它 四 HTTP 服务 带 发 送 任意 请 求 。 有 了 




















() NIH 综合 征 ( Not Invented Here Syndrome )， 指 的 是 社会 、 公 司 和 组 织 中 的 一 种 文化 现象 ， 人 们 不 愿意 使 用 、 购 买 
或 者 接受 某 种 产品 、 人 研究 成 果 或 者 知识 ,不 是 出 于 技术 或 者 法 律 等 因素 ， 而 只 是 因为 它 源 自 其 他 地 方 (摘自 
http://zh.wikipedia.org/wiki/NIH 综 合 征 )。 一 一 译 者 注 
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它们 ， 就 可 以 方便 地 一 舌 HTTP 请 求 的 真面目 了 。 

1. GET 请 求 的 工作 原理 

首先 ， 请 在 终端 窗口 中 执行 以 下 命令 局 动 nc 并 让 它 监 听 1156 号 端口 〈 端 口号 任意 ， 这 里 只 是 
举 个 例子 ): 

S nc -1 -pp 115é€ 
运行 起 来 之 后 ， 再 打开 一 个 窗口 ， 用 curl 向 本 地 的 1156 号 端口 发 送 一 条 GET 请 求 . 

$ curl http:;//localhost:1156/to6 

请 注意 localhost:1156 之 后 的 /foo。 切 换 至 第 一 个 终端 窗口 ， 你 会 看 到 nc 打印 出 了 以 下 
内 容 : 

GET /foo HTTP/1.1 

User-Agent: curl/7.16.3 (powerpc-apple-darwin9.0) libcurl/7.16.3 

OpenSSL/0.9.71 zlib/1.2.3 


Host: localhost:1156 
Accept: */* 


这 便 是 curl 发 送 的 HTTP 请 求 报 文 。HTTP 是 一 种 文本 协议 ， 阅 该 和 调试 起 来 都 很 方便 。 报 文 
的 第 一 行 给 出 了 请 求 的 类 型 (GET )、 资 源 ( /foo ) 以 及 当前 会 话 所 使 用 的 协议 (HTTP 1.1 )。 紧 
随 第 一 行 之 后 的 是 奉 干 HTTP 协议 头 ， 它 们 都 是 与 当前 请 求 相 关 的 附加 信息 ， 其 中 一 部 分 会 影响 
服务 器 的 行为 。 协 议 头 以 名 称 和 :开头 。 所 有 协议 头 罗列 完毕 之 后 有 一 个 空 行 ， 它 标志 着 报 文 头 
部 的 结束 ， 剩 下 的 便 是 消息 正文 (如果 有 的 话 )。 本 例 中 的 消息 正文 为 空 。 

当 你 浏览 网 页 时 ，Web 浏 览 需 发 给 服务 需 的 请 求 通常 都 是 GET 请 求 一 一 无 论 是 点 击 链接 、 打 
开 书 签 ， 还 是 在 浏览 器 的 地 址 栏 手 工 输入 URL ,都 是 如 此 。 在 处 理 这 种 请 求 时 ， 服 务 器 会 将 页 面 
内 容 作 为 应 答 发 送 给 浏览 融 。 

HTTP 服 务 器 发 送 的 应 答 报 文 的 第 一 行 可 分 为 三 部 分 ， 首 先是 协议 版 本 ， 紧 接着 是 数值 状态 
码 , 最 后 是 一 段 原因 说 明 , 这 段 文 本 以 人 类 可 读 的 方式 解释 状态 码 ( 这 段 描 述 没 有 什么 标准 可 言 ， 
也 不 一 定 非 要 用 英语 )。 状 态 码 的 最 高 位 数字 用 于 表示 状态 的 类 别 。 例 如 在 找 不 到 客户 端 所 请 求 
的 资源 时 ， 服 务 送 的 应 答 报 文通 帝 会 以 下 述 内 容 开 始 : 

HTTP/1.1 404 Not Found 

最 高 位 的 4 表示 服务 需 认 为 这 个 错误 源 自 客户 端 (例如 试图 请 求 不 存在 的 资源 )。 除 第 一 行 以 
外 ,应 答 报 文 的 格式 与 请 求 报 文 相同 : 知 干 个 协议 头 ， 紧 跟 独 一 个 空 行 ， 然 后 是 消息 正文 。 如 果 
网 页 请 求 有 至， 一 般 Web 服 务 需 会 返回 与 下 述 内容 相 近 的 应 答 : 

HTTP/1.1 200 OK 

Date: Sat, 08 May 2010 19:09:55 GMT 


Server: Apache 
Content-Type: text/html 












































<!IDOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN'"> 
<html]> 
<head> 
<title>Front Page</title> 
</head> 
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<body> 
<hli>Welcome</h]1> 
</body> 
</html> 


本 例 中 的 消息 正文 是 一 段 HTML 文 档 (参见 协议 关中 的 content-Type 字 上 段 )。 根据 资源 的 
性 质 ，HTTP 请 求 可 能 会 返回 各 种 类 型 的 数据 ， 比 如 JPEG 图 片 或 PDF 文 档 。content-Type 协 议 
头 可 以 帮助 客户 端 区 分 应 答 中 的 数据 类 型 。 

襄 无 疑问 ，GET 是 最 常见 的 请 求 类 型 。 不 过 HTTP 文 持 的 请 求 类 型 可 不 止 一 种 一 一 而 是 8 种 ， 
每 种 请 求 分 别 对 应 于 一 个 动词 (verb ) 一 一 在 后 面 的 REST 式 接口 的 开发 过 程 中 ， 还 要 用 到 其 中 
的 PUT 和 DELETE 动 词 。 接 着 往 下 看 。 

2. PUT 和 DELETE 

为 了 演示 PUT 的 用 法 ， 请 先 创建 一 个 名 为 puttxt 的 文本 文件 ， 文 件 内 容 只 有 一 个 单词 Erlang: 

$s echo Erlang > put.txt 

接 下 来 , 请 退出 运行 中 的 nc 和 curl 会 话 , 然后 重启 nc。 下 述 命 令 中 的 -Tf 选项 用 于 让 curl 将 文件 
PUT 至 指定 的 URL: 











$ curl -T put.txt http://localhost:1156/foc 


nc 的 输出 如 下 : 


PUT /foo HTTP/1.1 

User-Agent: curl/7.16.3 (powerpc-apple-darwin9.0) libcurl/7.16.3 
OpenSSL/0.9.71 zlib/1.2.3 

Host: localhost:1156 

Accept: */* 

Content-Length: 7 

Expect: 100-continue 


Erlang 

可 以 看 出 这 段 报 文 与 之 前 的 GET 请 求 顾 为 类 似 。 区别 在 于 第 一 行 中 的 GET 变 成 了 PUT, 请 求 报 
文 的 末尾 处 多 了 两 个 协议 涉 ， 用 于 表示 报 文 尖 部 完结 的 空 行 之 后 还 有 一 段 消 恩 正文 ( 即 put.txt 文 
件 的 内 容 )。content-Length 协 以 头 的 值 为 ?， 这 是 单词 Erlang 再 加 上 一 个 (类 UNIX 系 统 上 的 ) 
换行 符 的 长 度 ， 这 个 换行 符 是 在 创建 文件 时 由 echo 命 令 加 上 的 。 

发 送 完 PUT 请 求 后 ， 如 果 仔 细 观 察 nc 的 输出 ， 你 可 能 会 注意 到 请 求 报 文 中 的 消息 正文 并 不 是 
耿 即 出 现 的 o 这 是 请 求 中 的 协议 头 Expect : 100 -continue 的 缘故。 了 EXPec t 协 议 头 可 用 于 提升 
Web 交 互 的 效率 。 如 果 发 现 请 求 报 文中 有 它 ， 服 务 融 驶 应 该 发 送 应 答 “100 Continue”， 指 示 客 户 
闪 继 续 发 送 消息 正文 。 如 采 服 务 全 根本 不 打算 处 理 消息 正文 , 它 可 以 选择 立即 关闭 连接 ， 以 免 客 
户 并 半 羊 亩 雷 传 了 半天 数据 , 却 洛 得 个 被 服务 融 丢 弃 的 下 场 。 我 们 将 在 11.2.3 节 中 实现 目 己 的 Web 
服务 项 ， 届 时 你 将 会 看 到 这 个 协议 头 的 处 理 办 法 。 

最 后 ， 让 我 们 来 看 看 DELETE 请 求 。 再 次 重启 nc， 然 后 按照 以 下 命令 用 curl 发 送 DELETE 请 求 : 

> Url ~X DELETE htto// localhosts JJ 5 toc 


不 必 担 心 一 一 什么 都 删 不 挤 ; nc 只 会 忠实 地 显示 请 求 报 文 的 内 容 : 












































图 灵 社 区 会 员 for(;;)(13433955876@163.com) 专 享 尊重 版 权 


11.2 ”打造 一 套 全 新 的 Web 接口 237 


DELETE /foo HTTP/1.1 

User-Agent: curl/7.16.3 (powerpc-apple-darwin9.0) libcurl/7.16.3 
OpenSSL/0.9.71 zlib/1.2.3 

Host: localhost:1156 

Accept: */* 


可 以 看 出 , 除了 第 一 行 中 的 动词 有 所 不 同 以 外 ，DELETE 和 GET 的 请 求 报 文 如 出 一 办 。 然而 二 
者 的 语义 却 有 着 天 壤 之 别 : 同样 是 针对 资源 /foo， 这 个 请 求 可 不 是 要 下 载 ， 而 是 要 让 服务 规 删 
除 该 资源 。 请 注意 ， 我 们 不 打算 在 此 讨论 资源 的 精确 含义 一 一 这 是 个 非常 抽象 的 概念 。 对 于 一 
般 的 Web 服 务 带 来 说 ,资源 通 篆 就 是 文件 系统 上 的 文件 : GET 表 示 “ 请 给 我 发 送 一 份 该 文件 的 副 
本 ”，PUT 表 示 “ 文 件 上 传 ”，DELETE 表 示 “ 文 件 删除 ”。 当 然 了 ， 上 有 具体 含义 还 得 看 Web 服 务 需 。 
就 simple cache 接 口 而 言 ， 将 这 些 动词 视 作 文件 操作 显然 是 不 合 时 宜 的 ,应当 将 它们 转译 为 对 应 
的 绥 存 操作 。 

利用 HTTP 其 至 可 以 实现 一 僚 比 院 配 送 服务 ， 这 码 服 务 中 的 GET 表 示 订 购 比 萨 ( 可 以 将 配送 
地 址 连同 比 院 的 种 类 、 数 量 等 信息 一 并 编码 到 URL 中 )，PUT 表 示 上 传 新 食谱 至 菜单 ，DELETE 表 
示 删 除 食谱 。HTTP 规 范 只 关注 “资源 ”和 “资源 的 表述 形式 ”( 如 果 将 比 了 和 比 院 订购 分 别 视 作 
资源 和 请 求 , 那么 送 到 门口 的 贫 真 价 实 的 比 楷 便 可 被 视 作 资 源 的 一 种 “表述 形式 ”), 现在 你 已 经 
初步 掌握 了 HTTP 协 议 ， 让 我 们 开始 次 入 Web 服 务 需 的 实现 细节 吧 。 


11.2.2 ”实现 一 套 通用 的 Web 服 务 器 行为 模式 


我 们 打算 将 这 套 初 级 的 Web 服 务 需 实现 成 一 个 新 的 OTP 行 为 模式 ， 从 而 把 它 包 闭 成 独立 的 可 
复 用 组 件 。 首 先 ， 请 效仿 11.1.2 节 中 的 tcp_ interface， 在 现 有 应 用 的 基础 上 搭建 好 新 应 用 的 架子 。 
新 应 用 的 名 字 是 gen_web_server， 其 目录 结构 如 下 : 


Jen web server 






































|-- ebin 
| `-- gen web server.app 
“一 src 








|-- gen web server,.erl 
|-- gws_connection_sup.erl 
“一 -gws_ server,.erl 


gen web server 与 Erlang/OTP 标 准 库 stdlib 一 样 ， 都 属于 库 应 用 : 这 些 应 用 本 身 无 法 启动 ， 只 
能 被 用 作 其 他 主动 应 用 的 砖 瓦 。 因 此 ，.app 文 件 中 的 mod 项 〈 用 于 指定 应 用 局 动人 口 )、 
application 行 为 模式 的 实现 模块 ， 还 有 顶层 监督 者 模块 ， 统 统 都 可 以 省 略 。 


这 个 Web 服务 器 非常 简陋 

这 个 Web 服务 器 的 功能 并 不 完整 ， 请 不 要 把 它 用 到 线 上 环境 中 去 ! 虽然 为 REST 式 接 口 
的 实现 提供 了 一 些 便 利 , 但 它 毕 竞 只 是 个 示例 程序 , 我 们 只 是 用 它 来 演示 自 定 义 行 为 模式 的 创 
建 方 法 和 Erlang/OTP 的 实用 编程 实践 而 已 。 真 正 的 Web 服务 器 必 备 的 数据 分 块 、 长 连接 等 功 
能 它 都 不 具备 。 产 品级 质量 的 Erlang Web 服务 器 有 很 多 如 果 需 要 ， 不 妨 去 看 看 Yaws 或 
MochiWeb，Erlang/OTP 标准 库 自 市 的 inets httpd 服务 器 也 不 错 。 
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在 3.1.2 方 中 我 们 曾经 说 过 , 行为 模式 可 分 为 三 部 分 : 容 硕 、 接 口 和 实现 。 现 有 的 行为 模式 你 
都 见识 过 了 , 使 用 它们 时 只 需要 提供 行为 模式 的 实现 。 这 一 次 , 你 要 打造 的 是 一 个 全 新 的 行为 模 
式 ， 它 可 能 会 有 各 式 各 样 的 实现 ,你 的 任务 就 是 为 这 些 实现 提供 接口 和 容 硕 。 在 行为 模式 中 ， 容 
器 是 可 复 用 部 分 的 主体 ,实现 模块 通过 由 接口 定义 的 一 组 回调 冰 数 与 容 顺 对 接 。 在 本 例 中 ， 这 个 
容 需 就 是 我 们 的 通用 Web 服 务 硕 。 

gen web Server 容 需 的 结构 如 图 11-2 所 示 。 其 中 gen web _ serverer] 是 前 闫 API 模 块 ， 它 负责 屏 
菩 内 部 细节 ， 行 为 模式 的 用 户 只 会 跟 它 打 交 送 。 行 为 模式 的 接口 也 由 该 模块 指定 。 

行为 模式 实例 




















gen web server gws_connection sup 
_WeD_ > 4 
前 中 模块 (简易 一 对 一 监督 者 ) 


< 一 > 


gwS_Server 


图 1]1-2”gen web_server 的 进程 和 模块 


图 11-1 已 经 展示 了 gen_web_server 容 可 实例 的 两 个 组 成 部 分 : 一 个 监督 进程 ， 以 及 隶属 于 它 
的 多 个 动态 创建 的 服务 需 进 程 。 

HTTP 无 非 就 是 构筑 于 TCP 之 上 的 一 个 文本 协议 ， 因 此 gen_web_server 实 例 的 工作 模式 与 
11.1.3 节 中 的 tcp_ interface 应 用 大 同 小 异 。gen web_server 行 为 模式 的 实例 也 是 由 多 个 进程 组 成 ， 
进程 数量 可 变 而 且 没 有 上 限 。( 相 较 之 下 ，gen server 实 例 只 有 一 个 进程 。) 不 同 的 实例 负责 不 同 
的 IP 地 址 /TCP 端 口 组 合 。 在 自己 所 负责 的 端口 上 ,每 个 实例 都 可 以 处 理 为 数 众多 的 外 部 连接 ,其 
中 每 个 连接 都 由 一 个 独立 的 gws_server 进 程 负 责 打 理 。 

和 tcp_interface 应 用 一 样 ，gws_connection_ sup 模块 也 是 个 简易 一 对 一 监督 者 ， 而 且 同 样 被 用 
作 处 理 需 进程 工矿。 连接 处 理 天 由 gws_server 模 块 实 现 ， 该 模块 和 11.1.3 世 中 的 全 server 类 做; 不 
过 ， 虽 然 都 是 gen_server，HTTP 协 议 的 实现 复杂 度 可 比 简单 文本 协议 要 大 得 多 了 。 

我 们 先 从 前 端 模 块 gen_web_server 讲 起， 你 将 会 看 到 行为 模式 接口 的 定义 非常 简单 明了 。 

1. gen_web_server 模 块 : 自 定义 行为 模式 

编译 器 只 要 看 到 -behaviour (x) 声明， 就 会 尝试 调用 模块 x 寻找 行为 模式 接口 。 以 ti_server 
为 例 , 当 编 译 器 发 现 模块 中 写 有 -behavi Our (gen server) 时 编译 需 便 会 调用 gen_s erver: 
behaviour_info(callbacks,) 获取 gen server 实 现 模块 所 应 导出 的 回调 也 数 列表 。 也 就 是 说 ， 
行为 模式 应 该 与 行为 模式 接口 定义 模块 同名 。 

行为 模式 接口 模块 至 少 要 导出 一 个 函数 , 即 behaviour_info/1。 它 只 接受 一 个 参数 ， 即 用 
于 辨别 得 查询 信息 类 别 的 原子 。 目 前 唯一 合法 的 参数 值 是 callbacks。 对 于 其 他 参数 值 , 该 函数 
一 律 返回 undefined。 但 如 果 碰 到 callbacks， 它 便 会 返回 一 张 包 含 该 接口 所 需 的 所 有 回调 孙 
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数 的 列表 ， 其 中 每 个 孙 数 以 一 个 由 吗 数 名 和 元 数组 成 的 二 元 组 表示 。 请 在 Erlang shell 中 调用 
gen_servez:behaviour_infol(callbacks) 一 探究 葛 ， 返 回 的 列表 很 是 有 眼熟 吧 
1> gen server:behaviour info(callbacks). 
[Lan 
{handle call,3}, 
{handle cast,2}, 
{handle info,2}, 
{terminate,2}, 


{code_ change,31}] 
2> 


在 编写 行为 模式 的 实现 模块 时 ,一旦 忘记 实现 (或 导出 ) 必要 的 图 数 ， 编 译 器 便 会 根据 这 些 
信息 发 出 警告 ,在 定义 新 的 行为 模式 时 必须 提供 这 个 函数 ,代码 清单 11-5 中 罗列 了 gen_web_server 
模块 的 完整 实现 。 如 你 所 见 ， 其 中 确实 包含 一 个 behaviour_info/1 拯 数 @, 该 也 数 返回 的 列表 
中 共有 9 个 回调 ， 除 init/1 以 外 ， 所 有 回调 均 与 GET 和 POST 等 HTTP 方 法 有 关 。 








代码 清单 11-5 gen web server.erl 


-modulelgen web server). 


Oo 
oo 


API 
-export{( [start link/3, start link/4, 
http _ reply/l1, http reply/2, http _ reply/3]1). 


-export{ [behaviour info/l1]}). 


behaviour_infolcallbacks) -> 
[ {init,1}, 
{head, 3}, 
loSb 3) 0 本 
{delete, 3}, Dj 定义 行为 模式 接口 
{options, 4}, 
{Bost, 4}, 
lButs a 
{trace, 4}, 
{other methods, 4}1]; 
behaviour info{( Other) -> 
undefined. 











start link{tCallback, Port, UserArgs) 一 > 
start_link(Callback, undefined, Port, UserArgs). 启动 新 实例 


start_ link{Callback, IP, Port, UserArgs) -> 
gws_connection sup:start_ link(Callback, IP, Port, UserArgs). 








http_ reply (Code, Headers, Body) -> 
ContentBytes = iolist to binary (Body)}), 
Length = byte size(ContentBytes), 居 构 造 HTTP 应 答 
[i1o_lib:format ("HTTP/1.1 ~s\r\n~sContent-Length: ~w\r\n\r\n'", 
[response (Code}, headers (Headers}, Length]}, 
ContentBytes]. 
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http reply {Code) -> 
http_ reply (Code, <<>>}). 


http replylCode, Body}) -> 
http_reply (Code, [{"Content-Type", "text/html"}], Body). 





headersl[{Header, Text} | Hs]) -> 
[io_lib:format("~s: ~s\r\n", [Header, Text]) | headers (Hs})]:; 
headers([]) -> 


Ls 





务 千 Fill in the missing status codes below if you want: 
response{100) -> "100 Continue",; 
response(200) -> "200 OkK",， 
response{404) -> "404 Not Found"; 
(501) -> "501 Not Implemented"; 
responsel(Code) -> integer to list (Code). 


实现 gen web _ servei 行 为 模式 的 模块 必须 一 个 不 落地 导出 各 中 的 所 有 9% 个 回调 函数 ; 服务 器 会 
将 收 到 的 所 有 请 求 一 一 转发 给 实现 模块 中 的 相应 回调 。 璧 如 收 到 的 PUT 请 求 将 被 转交 给 实现 模块 
中 的 put/4 图 数 处 理 。 和 gen server 不 同 ，gen web server 实现 模块 中 的 init/1 函 数 负 责 的 并 不 
是 整个 行为 模式 的 一 次 性 初始 化 ， 而 是 图 11-2 中 所 有 gws _ connection 连 接 处 理 带 进程 的 初始 化 。 
最 后 , other_methoqs/4 回 调 负责 处 理 那些 不 太 党 用 的 HTTP 方 法 , 可 用 于 实现 WebDAV 等 HTTP 
扩展 协议 。 

gen web _server 模 块 提供 的 API 很 简洁 。 一 对 start_link 函 数 @ 人 负责 启 动 新 的 行为 模式 实例 
( 其 中 start _ link/3 末 用 默认 IP, start_1Link/4 采 用 目 定 义 了 下 一 一 后 者 可 用 于 拥有 多 个 网 络 接 
口 的 主机 )。 除 耻 信息 以 外 ，start_1Link 还 需要 一 些 参 数 , 包括 回调 模块 的 模块 名 ( 每 个 行为 模 
式 都 需要 )、TCP 监 听 端 口号 ， 以 及 一 张 附 加 人 参数 列表 。init7/1 会 将 这 些 附 加 参数 传递 给 后 续 新 
建 的 所 有 连接 处 理 需 进程 。 这 套 API 还 提供 了 一 个 工具 困 数 http_reply@@， 用 于 辅助 
gen web _ server 实现 模块 组 织 正确 的 HTTP 应 答 报 文 ; gws_server 模 块 在 生成 “100 Continue” 自 动 
应 答 报 文 时 也 会 调用 这 个 水 数 。 

搞定 前 端 模 块 之 后 ， 下 一 步 就 是 图 11-2 中 的 监督 者 模块 gws_connection sup。 

2. gws_connection_sup 模 块 

跟 tcp_interface 应 用 一 样 ，gen web _server 也 采用 人 简易 一 对 一 监督 者 来 管理 连接 处 理 带 ， 
这 个 监督 者 同样 也 莱 任 着 连接 处 理 疾 进程 工厂 的 角色 。 每 个 gen_web_server 实 例 都 会 在 启 
动 时 创建 一 个 gws_connection sup 进程 来 监听 指定 端口 ， 只 要 服务 需 实 例 不 退出 ， 该 进程 就 
不 会 终止 。 

请 将 代码 清单 11-6 中 的 gws connection sup 与 11.1.3 节 中 的 fsup 模 块 (代码 清单 11-2 ) 做 一 个 
对 比 ， 你 会 发 现 前 者 的 start_1ink 和 start_childq 这 两 个 函数 多 出 了 几 个 参数 ,而 且 监 听 套 接 
字 是 在 监督 者 模块 的 init/1 国 数 中 打开 的 。 


response 
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代码 清单 11-6 gws connection sup.erl 
-module (gws connection sup}. 


-behaviour (supervisor). 


op 
op 


API 
-export ( [Start link/4, start child/1]). 


%%S Supervisor callbacks 
-export{ [init/1]). 





start_link(Callback, IP, Port, UserArgs) -> 


{ok, Pid} = supervisor:start link(?MODULE, [Callback, IP, 


Port, UserArgs|]), 


start child'(Pid}, 
{ok, Pid}. 


start child({(Server) -> 
supervisor:start child(Server, [1]). 


。 启动 第 一 个 gws_ 


server 子 进程 





init{[Callback, IP, Port, UserArgs]) -> 
BasicSockOpts = [binary, 
{active, false}, 
{packet, http_ bin}, 
{reuseaddr, true}], 
SockOpts = case IP of 
undefined -> BasicSockOpts; 
-> [{ip,IP} | BasicSockOpts] 





end, 
{ok, LSock} = gen tcp:listen!(Port, SockOpts}), 
Server = {gws_ server, {gws_ server, start link, 
[Calllback, LSock, UserArgs|]}, 
temporary, brutal kill, worker, [gws server]}, 


RestartSstrategy = {simple_one_ for_ one, 1000, 3600}, 
{ok, {RestartSstrategy, [Server]}}. 


本 例 中 的 监督 进程 运行 起 来 之 后 ，start_link/4 限 数 会 立即 启动 第 一 个 gws_server 子 进程 。 
这 一 步 也 可 以 并 入 gen_web_server: start_link/4 中 执行 ,不 过 当前 这 种 做 法 可 以 确保 新 启动 
的 gws_connection sup 进 程 背后 总 有 一 个 进程 随时 待命 ， 负 责 处 理 监 昕 套 接 字 上 收 到 的 外 来 连接 。 











打开 端口 时 用 到 的 新 选项 





打开 监听 套 接 字 时 ， 我们 用 到 了 一 些 新 选项 @。 首 先 ，binary 表 示 发 送 外 来 数据 时 应 采用 
二 进 制 串 而 非 字 符 串 的 形式 。 其 次 ，{active，false} 表 示 用 被 动 模式 打开 套 接 字 。 再 次 ， 
{packet，http_bin} 告 诉 套 接 字 外 来 数据 遵循 HTTP 格 式 。 局 用 该 选项 后 ， 套 接 字 会 
本 数据 解析 成 更 易于 处 理 的 消息 ， 不 但 可 以 为 你 省 去 大 量 体 力 活 ， 还 可 以 提升 HTTP 请 求 的 处 理 
速度 。 详 情 参 见 稍 后 实现 的 gws_server 模 块 。 最 后 ，{reuseadqdqr，true} 用 于 快速 复 用 本 地 端 
口号 ， 如 果 不 启 用 这 个 选项 ， 服 务 器 就 必须 等 到 监听 套 接 字 在 OS 内 核 中 超时 后 才能 再 次 〈 在 同 








一 端口 上 ) 启动 。 
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动 将 文 


TCP 流量 控制 与 主 /被 动 套 接 字 

尽管 主动 模式 条 理 更 清晰 ， 写 出 来 的 代码 也 更 具 Erlang/OTP 风范 ， 但 它 却 无 法 提供 流量 
控制 。 在 主动 模式 下 ， 套 接 字 上 有 多 少数 据 Erlang 运行 时 系统 就 读 多 少数 据 ， 一 读 完 就 立即 
以 Erlang 消息 的 形式 传递 给 持 有 套 接 字 的 进程 。 如 果 客 户 端 的 发 送 速 度 比 接收 方 的 读 取 速度 
快 ， 那么 消息 队列 就 会 不 断 增长 并 最 终 将 内 存 耗 尽 。 在 被 动 模式 下 , 持 有 套 接 字 的 进程 必须 显 
式 读 取 套 接 字 中 的 数据 , 这 么 做 会 增加 代码 的 复杂 度 , 但 却 可 以 更 精细 地 控制 系统 接收 数据 的 
时 机 和 速率 ， 还 可 以 依靠 TCP 内 置 的 流量 控制 功能 来 自动 限制 发 送 方 的 发 送 速度 。 








你 可 能 已 经 注意 到 了 , 在 这 个 模块 中 我 们 打破 了 不 给 监督 者 谎 加 额外 功能 的 规矩 。 其 原因 在 
于 gen_ web_server 是 个 库 应 用 ,没有 可 用 于 寄 放 这 些 代 人 码 的 _app 模 块 ( tcp_interface 应 用 是 有 的 )。 
要 想 把 这 上 段 代 码 挪 出 gws_connection sup， 至 少 还 得 再 加 一 个 进程 ， 甚 至 很 可 能 还 得 再 增加 一 层 
监督 结构 。 对 于 本 书 来 说 ,未 免 太 小 题 大 作 了 。 不过, 按照 这 个 思路 对 程序 做 个 结构 调整 倒是 个 
不 错 的 练习 。 切 记 ， 只 要 服务 器 实例 还 活着 ， 持 有 监听 套 接 字 的 进程 就 不 能 停 ”。 因 此 监听 套 接 
字 不 能 在 gen web server 的 start_lLink/4 中 打开 ，gws server 进 程 就 更 不 用 提 了 。 

将 这 部 分 功能 放 和 人 gws_connection sup 还 有 另外 一 个 理由 ， 那 就 是 在 实际 应 用 当中 ， 
gws_connection_sup 根 本 没有 机 会 成 为 项 层 监 督 者 。 如 图 11-3 所 示 ， 无 论 何 时 ，gen_web_server 容 
句 都 只 能 在 其 他 高 层 监 督 者 的 管辖 之 下 作为 某 个 应 用 的 一 部 分 而 启动 。 
























应 用 顶层 


监督 者 


gws connection Sup 


gWSs_ server 


图 11-3 ”在 更 大 范围 的 应 用 中 使 用 gen web server 时 的 监督 结构 。gws connection sup 
不 会 被 用 作 顶 层 监 督 者 ， 即 便 代码 中 有 bug， 也 不 会 殊 及 整个 应 用 


也 就 是 说 ， 如 果 挫 林 在 init/1 中 的 代码 导 人 至 gws_connection sup 进 程 故障 ， 上 层 监督 者 也 有 
能 力 捕 获 这 个 错误 。 有 了 这 重 保障 ， 即 便 故 障 会 波及 应 用 的 其 他 部 分 ， 影 响 面 也 十 分 有 限 。 不 过 
gws_connection_ Sup 要 是 重启 失败 ， 整 个 应 用 还 是 会 彻底 完 重 。 这 方面 的 风险 不 可 小 裔 。 





故障 隔离 与 监督 者 的 稳定 性 
图 11-3 中 的 顶层 监督 者 一 共 启 动 了 两 个 工作 进程 ,左边 的 是 个 独立 进程 ， 右 边 的 是 gen_ 


中 否则 监听 套 接 字 将 被 自动 关闭 ， 参 见 11.1.3 方 。 一 一 译 者 注 
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Web server 的 一 个 实例 。 监 督 者 可 以 在 协调 多 组 进程 的 同时 让 它们 彼此 隔离 。 如 果 
gwWS_connection Sup 进程 组 发 生前 渍 ， 剩 下 的 独立 工作 进程 不 会 受到 任何 影响 (不 过 监督 者 有 
可 能 会 让 它 一 并 重启 )。 正 是 因为 如 此 ,我 们 才 要 求 尽量 不 要 在 监督 者 中 掺 杂 应 用 相关 代码 。 

监督 者 通常 都 是 高 度 可 徘 的 。 监督 者 一 旦 发 生 不 测 , 整个 监督 体系 的 容错 能 力 便 会 受到 严 
峻 挑战 。 顶 层 监 督 者 尤其 如 此 ， 它 要 是 出 了 问题 ， 整 个 应 用 都 得 跟着 重启 一 一 如 果 是 
permanent 型 应 用 (参见 10.1.3 节 )， 甚 至 还 会 株连 整个 节点 。 





从 实现 策略 上 讲 ，gws_connection sup 和 11.1.3 节 中 的 { sup 之 间 的 差异 虽 不 明显 ， 但 却 十 分 
关键 。 明 日 了 这 一 点 ， 我 们 就 可 以 开始 人 研究 更 具 实 质 性 的 问题 了 : 那 就 是 用 于 人 处理 真正 的 HTTP 
连接 的 gws_server 模 块 。 

3. gws _Sserver 模 块 及 {active，oncel} 选 项 

和 ti server 模 块 一 样 ，gws_server 也 是 用 gen server 实 现 的 。 在 套 接 字 的 处 理 策略 上 二 者 如 出 
一 办 ， 都 采用 了 延迟 初始 化 的 手法 。 具 体 做 法 都 是 在 init/1 回 调 的 返回 值 中 将 超时 置 零 ， 从 而 
将 初始 化 延 公 到 handle_info (timeout, state) 中 。 在 初始 化 过 程 中 ，gws_server 会 阻 蹇 等待 
gen_tcp:accept() 返 回 , 然后 通知 监督 者 铂 生 新 的 处 理 硕 进程 。 不 过 在 处 理 来 和 目 套 接 字 的 外 部 
数据 时 ， 二 者 之 间 又 存在 明显 的 差异 。 

在 tcp_interface 应 用 中 ， 我 们 曾经 用 过 套 接 字 选 项 {factive，true}。 有 局 用 该 选项 后 ，ERTS 
会 目 劲 谈 取 套 接 字 收 到 的 所 有 数据 并 将 之 转换 成 Erlang 消 息 发 送 给 持 有 套 接 字 的 进程 。 这 一 机 制 
有 效 催 化 了 基于 事件 模型 的 代码 , 但 它 的 缺点 就 是 主动 套 接 字 无 法 提供 流量 控制 。 如 有 果 客 户 端的 
数据 发 送 速度 过 快 ， 服 务 硕 的 内 存 束 会 被 无 节制 增长 的 消息 队列 耗 尽 。 另 一 方面 ， 如 采 换 用 
{active，false} 选 项 ， 接 收 进程 就 必须 通过 gen_tcp:read() 从 三 接 字 中 显 式 该 取 就 绪 的 数 
据 。 这 样 一 来 ， 如 果 接 收 方 跟 不 上 发 送 方 的 速度 ，TCP 内 置 的 流量 控制 机 制 便 会 生效 ， 阻止 发 送 
方 进一步 发 送 数 据 ， 从 而 规避 服务 需 端 内 存 耗 尽 的 风险 。 可 是 ， 这 一 方式 又 和 Erlang 的 编程 风格 
格格 不 入 。 

第 三 条 出 路 就 是 factive，once} 选 项 , 这 正 是 本 例 所 采用 的 方法 。 该 选项 可 以 将 套 接 字 临 
时 置 为 主动 模式 。 等 套 接 字 再 次 收 到 数据 , 并 以 Erlang 消 息 的 形式 将 数据 发 送 给 持 有 者 进程 之 后 ， 
套 接 字 又 会 被 和 目 动 重 置 为 被 动 模式 , TCP 内 置 的 流量 控制 也 随 之 生效 。 在 控制 进程 明确 表态 之 前 ， 
套 接 字 中 的 数据 不 会 再 被 恋 取 ， 也 不 会 再 产生 新 的 消 且 。 探 制 进程 准备 就 绪 后 通常 会 再 次 启用 
{active，once} 选 项 ， 然 后 等 待 下 一 条 消息 。 下 列 代 码 中 演示 了 如 何 配合 简单 的 循环 来 使 用 


{active, once}: 


















































start{(}) -> 
{ok, LSock} = gen tcp:listen(1055, [binary, {active, false}])}), 
{ok, Socket} = gen tcp:accept (LSock), 
loop (Socket). 


loop (Socket) -> 
inet:setopts{Socket, [{active,once}]), 
recelve 
{tcp, Socket, Data} -> 
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io:format ("got ~p~n'", [Datal) ， 
loop(Socket}).; 
{tcp_closed, _Socket} -> 
OK 
engd. 


一 步 是 创建 用 于 接受 外 部 连接 的 监听 套 接 字 , 进而 获取 一 个 连接 套 接 字 。 紧 接着 进入 循环 ， 
ee setopts/2， 局 用 {active，once} 选 项 ， 然 后 坐等 由 套 接 字 发 出 的 
消息 。 如 有 数据 到 来 ， 就 接收 数据 并 进行 处 理 。 此 时 套 接 字 又 被 重 置 成 了 被 动 模式 。 于 是 ,在 下 
一 轮 循 环 中 ， 你 需要 再次 局 用 {active，once} 并 等 竺 新 消息 。 

除 上 述 差异 之 外 ,ti_server 和 gws_server 模 块 之 间 最 具 实 质 性 的 区 别 还 是 在 协议 处 理 上 。 前 者 
只 实现 了 一 套 简 单 协议 ， 后 者 却 需要 处 理 HTTP 的 子 集 。 该 模块 的 代码 如 代码 清单 11-7 所 示 。 乍 
一 看 代码 很 多 ， 其 实 并 不 复杂 。 


代码 清单 11-7 gws server.erl 


-module (gws server). 




















-behaviour (gen server). 





-export ([start link/3]). 





竺 省 gen_server callbacks 
-export([init/l1l, handle_ call/3, handle cast/2, handle info/2, 
terminate/2, code change/3]). 


-record(state, {lsock, socket, request line, headers = [|], 
body = <<>>, content remaining = 0, 服务 器 状态 记录 
callback, user data, parent})}). 





start_link(Callback, LSock, UserArgs) -> 
gen server:start link'{(?MODULE, 
[Callback, LSock, UserArgs, self'(})}], []). 








init([Callback, LSock, UserArgs, Parent]) -> 
{ok, UserData} = Callback:init (UserArgs), 


State = #¥state{lsock = LSock, callback Callback, 
user_ data = UserData, parent = Parent)}, 

{ok, State, 0O}. 
handle_call{_ Request, _From, State) -> 

{reply, ok, Statel}. 

~ i 圭 疏 Y” 

handle castt{_ Request, State) -> 处 理 请 来 报 文 

{noreply, State}. 
handle info{({{http, _Sock, {http reguest, _, _, _}=Reguest}, State) 一 > 

inet:setopts!(Statetstate.socket, [{active,once}]}), 


{noreply, Statetstate{regquest line = Regquest}}:; 
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hanale lnfolfnttPp，_ Sock，fhttp header, _, Name, _, Value}}, State) -> 
inet:setopts (Statetstate.socket, [{active,once}l])}), 
{noreply, header (Name, Value, State)}.; ee 
handle_info({http, _Sock, http_eoh}, 
tstate{content_ remaining = 0} = State) -> 报 文 头 部 结束 ， 消 
{stop, normal, handle http _ request (State)}:; 息 正 文 为 空 
handle_ info({http, _Sock, http_eoh}, State} -> - 
inet:setopts (Statetstate.socket, [{active,once}, {packet, raw}l]), 


{noreply, State}; 
handle_ infol({tcecp, _Sock, Datal}, State) when is binary (Data) -> 





ContentRem = Statetstate.content_ remaining - byte sizel{lData}), 报 文 头 部 结束 ， 准 
， ~ I= 器 9 
Body = list to binary( [State#tstate.body, Datal])}), 备 接收 消息 正文 
1 


NewState = Statetstate{body = Body, 
content_remaining = ContentRem}, 
if ContentRem > 0 -> 


inet:setopts{(Statetstate.socket, [{active,once}l]), 
{noreply, NewState}; 
true 一 > 


{stop, normal, handle http_ reauest (NewState)} 

end:; 
handle info({tcp closed, Sock}, State) 一 > 
{stop, normal, State}:; 
handle _ info(timeout, #state{lsock = LSock, parent = Parent} = State) -> 
{ok, Socket} = gen tcp:accept (LSock), 
gws_cConnection sup:start_child!(Parent), 
inet:setopts{(Socket, [{active,once}]), 
{noreply, Statei#tstate{socket = Socket}}. 








terminate{( Reason, _State) -> 等 待 连接 ， 然 后 启 
OK . 动 新 的 处 理 器 


code change!{ OldVvesn, State, Extra) 一 > 
{ok, State}. 





ContentLength = 0 (pinary to list(Value)), 后 续 处 理 做 准备 
Sstatetstate{content remaining = ContentLength, 
headers = [{Name, Value} | Stateitstate.headers]}: 

header (<<"Expect">> = Name, <<"1]00-continue">> = Value, State) -> 

gen_tcp:send(Sstate#state.socket, gen web_ server:http_reply(100))}), 

Statetstate{fheaders = [{Name, Value} | State#tstate.headers]}; 
header {Name, Value, State) -> 

Statetstate{headers = [{Name, Value} | Statetstate.headers]}. 


header('Content-Length' = Name, Valjue, State) -> i 
( g ) 有 记 住 内 容 长 度 ,为 





让 客户 端 继续 
handlje httpe regquest (#state{callback = Callback, 
request_line = Request, 
headers = Headers, 
body = Body, 
user_ data UserData} = State) 一 > 
{http request, Method, _, _} = Regquest, 
Reply = dispatch{({Method, Request, Headers, Body, 
Callback, UserData), 
gen_tcp:send(Statei#state.socket, Reply)}), 


State. 执行 回调 获取 结果 人 @) 
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dispatch('GET', Regquest, Headers, _Body, Callback, UserData) -> 
Callback:get (Request, Headers, UserData)},; 

dispatch('DELETE', Request, Headers, _Body, Callback, UserData) -> 
Callback:delete({Request, Headers, UserData),; 

Qispatch('HEAD', Request, Headers, _Body, Callback, UserData) -> 
Callback:headiReaquest, Headers, UserData). 

dispatch!('POST', Reaquest, Headers, Body, Callback, UserData) -> 
Callback:post (Regquest, Headers, Body, UserData); 

dispatch('PUT', Regquest, Headers, Body, Callback, UserData) -> 
Callback:put (Reauest, Headers, Body, UserData).; 

Qispatch('TRACE', Reaqauest, Headers, Body, Callback, UserData) -> 
Callback:trace(Regquest, Headers, Body, UserData):; 

dispatch!('OPTIONS', Request, Headers, Body, Callback, UserData) -> 
Callback:options (Request, Headers, Body, UserData): 

dispatch!{(_ Other, Reaquest, Headers, Body, Callback, UserData) -> 
Callback:other methods (Request, Headers, Body, UserData). 


这 个 gen_server 的 服务 器 状态 记录 中 存 的 东西 还 真是 不 少 故 。lsock 和 socket 字 上 段 分 别 是 监 
上 听 套 接 字 和 连接 套 接 字 。 request 11ne、headqers、 body 和 content_remaining 字 上 段 用 于 处 
理 HITP 协 议 。cal1lback 字 段 是 行为 模式 实现 模块 的 模块 名 ，user_data 则 是 需要 传递 给 回调 
模块 的 应 用 相关 数据 。 最 后 ，parent 字 段 中 保存 的 是 gws_connection sup 监督 者 的 进程 ID。 

tcp_interface 应 用 的 ti_sup 监 督 者 模块 是 以 注册 进程 的 形式 运行 的 ， 最 多 只 能 运行 一 个 实例 。 
但 gen_web_server 可 以 并 行 启动 多 个 实例 ， 为 此 gws_server 进 程 必须 知道 自己 隶属 于 哪个 监督 者 。 
该 信息 由 start_link/3 图 数 负 责 采 集 ， 它 会 记 下 调用 进程 (一般 情 况 下 应 该 是 某 个 
gws_connection sup 进程 ) 的 pid， 再 以 调用 参数 的 形式 自动 传递 给 init/1。 

start_l1ink/3 图 数 的 参数 包括 行为 模式 回调 模块 、 监 听 套 接 字 以 及 一 张 附加 参数 列表 
(UserArgs ); 这 些 附加 参数 由 gen_web_server 行 为 模式 的 用 户 提 供 ， 最 终 会 原封 不 动 地 传递 至 
init/1。UserArgs 参 数 的 传递 构成 了 容 剖 框架 与 用 户 提 供 的 行为 模式 回调 模块 之 间 的 冯 次 交互 
( 这 和 gen_server 新 实例 启动 时 调用 用 户 提 供 的 ijnit/1 回 调子 数 是 一 样 的 道理 )。 

init/IL 函 数 一 返 回 ， 新 的 服务 大 进程 便 会 触发 超时 ， 转 而 进入 handle_info (timeout, ...)。 
和 此 前 一 样 ， 服 务 需 将 在 此 处 阻塞 执行 accept () 并 要 求 启 动 新 的 处 理 需 进程 候 、 请 注意 ， 正 如 
代码 清单 11-7 之 前 的 简短 示例 所 示 ， 连 接 套 接 字 立即 被 打上 了 {tactive，once} 标 记 ， 进 而 被 存 
和 人 服务 硕 状 态 记 录 。 

搞定 上 述 事 项 之 后 , 剩 下 的 便 是 HTTP 协 议 的 处 理 。 请 回想 一 下 11.2.17 中 的 那些 HTTP 请 求 。 
以 PUT 请 求 为 例 ， 当 消息 正文 为 “Hello!” 时 ， 请 求 报 文 如 下 : 


PUT /foo HTTP/1.1 

User-Agent: curl/7.16.3 (powerpc-apple-darwin9.0) libcurl/7.16.3 
OpenSSL/0.9.71 zlib/1.2.3 

Host: localhost:1156 

AccCept: */* 

Content-Length: 7 

Expect: 100-continue 





















































Hello! 
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一 般 而 言 ，HTTP 请 求 报 文 的 结构 如 下 : 

口 请 求 行 ; 

口 协议 头 ( 数量 任 总 ); 

D 一 个 空 行 ; 

口 消 且 正文 。 

还 记得 我 们 在 代码 清单 11-6 中 创建 监听 套 接 字 时 用 到 的 {packet，http_bin} 选 项 吗 ? 只 
要 局 用 该 选项 ， 套 接 字 了 恕 会 符 你 完成 协议 解析 工作 ， 发 出 的 消息 也 更 多 于 处 理 。 首 先 ， 当 新 请 求 
到 来 时 ,请求 行将 被 解析 为 以 下 格式 的 消 朋 (沿用 上 述 的 PVT 示例 ): 

{http, Socket, {http request, ‘PUT’', <<'"/foo">>, {1,1}}} 

请 注 间 ,HTTP 方法 是 以 原子 的 形式 给 出 的 (位 于 单 引 号 内 )。 只 有 HTTP 规 范 中 列 出 的 7 个 党 
用 方法 才 享 有 这 个 待遇 。 对 于 其 他 无 法 识别 的 HTTP 方 法 ， 方 法 名 会 以 二 进 制 串 的 形式 给 出 一 一 
例如 <<" PATCH">>， 或 是 <<" MKCOL">> (对 应 于 WebDAV 中 的 MKCOL 方 法 )。 

收 到 的 请 求 行 @ 会 被 存 入 服务 器 状态 。 然 后 ， 你 应 该 再 次 将 套 接 字 置 为 {active, once} 以 
读 取 更 多 客户 绵 数据 。 可 以 看 到 ， 在 需要 从 公 接 字 上 恋 取 更 多 数据 时 ，nandle_info 限 数 的 各 
个 子 句 都 会 这 么 做 。 

处 理 完 请 求 行 之 后 ， 一 般 还 会 收 到 若干 协议 头 。 局 用 {packet，http_bin} 选 项 之 后 ， 套 
接 字 会 目 动 解析 各 个 HITP 协 议 头 ， 然 后 按 以 下 格式 给 你 发 送 消息 : 

{http, _Socket, {http_ header, Length, Name, _ReservedField, Value}} 

人 负责 处 理 这 些 消 息 的 handle_info 子 名 全 将 大 部 分 实质 性 工作 委托 给 了 内 部 函数 neader/3。 
该 函数 主要 负责 将 各 协议 头 存 人 服务 硕 状态 中 的 一 个 列表 内 , 不 过 在 两 种 特殊 情况 下 还 有 些 和 额外 
工作 要 做 。 在 处 理 content-Length 协 议 头 时 国 ， 数 据 要 以 整数 形式 存 人 服务 器 状态 的 
content_remaining 字 段 。 这 份 数据 将 用 于 接收 请 求 报 文 的 消息 正文 。 碰 到 携 市 "100-continue" 
的 Expect 协 议 头 时 和， 应 向 客户 端 发 送 HTTP 应 答 "100 continue" 以 告知 客户 端 继续 发 送 数据 
(参见 11.2.1 )。 如 有 果 不 发 送 应 答 ， 客 户 端 会 完 暂 停 两 秒 钟 再 开始 传输 消息 正文 ， 从 而 大 大 拖 慢 
整体 进度 。 

遇 到 用 作 请 求 报 文 头 部 结束 符 的 空 行 时 ， 套 接 字 会 发 送 一 条 以 下 格式 的 消息 : 

ftEtD， Socket, EEC- 

如 果 content-Length 协 议 头 的 值 为 去 〈 保 存在 服务 融 状 态 记录 的 content_remaining 宁 
段 中 )， 就 意味 着 请 求 报 文 不 含 消息 正文 全 。 这 时 你 只 要 处 理 请 求 并 发 送 应 答 就 可 以 了 。 但 如 果 
消息 正文 非 空 @， 则 需要 将 套 接 字 从 {packet，http_pbin} 状 态 切 换 至 {packet，raw} 状 态 ， 
让 它 停止 HTTP 解析 ， 把 接收 到 的 数据 转换 成 普通 的 {tcp，Socket，Datal} 格 式 。 收 到 这 类 消息 
时 , 必须 将 数据 奶 加 到 服务 硕 状态 的 bodqy 宇 段 (初始 为 一 个 空 的 二 进 制 串 ) 并 相应 减 小 content_ 
remaining 计 数 ， 直至 该 计数 带 归 零 。 直到 那 时 你 才 能 够 用 nandle_nhttp_request/1 处 理 完整 
的 请 求 报 文 。 

gen Web_server 容 佑 代码 与 用 户 定 义 的 行为 模式 实现 模块 ( 即 回调 模块 ) 之 间 的 交互 主要 发 
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生 在 这 个 盟 数 中 。 此 前 我 们 只 在 设置 服务 融 状 态 记 录 的 user_dqata 字 段 时 调用 过 ;inity/1 回 调 。 
现在 ， 你 得 按 消 县 中 注 明 的 HTTP 方 法 将 之 前 采集 到 的 所 有 与 请 求 报 文 相 关 的 信息 一 一 派发 给 相 
应 的 回调 吨 数 。 

为 此 人 @， 首 先 需 要 从 服务 右 状 态 中 提取 所 需 的 字段 ， 包 括 请 求 结 构 中 的 HTTP 方 法 名 。 从 后 
将 请 求 派发 给 回调 模块 中 的 对 应 函数 ， 由 这 些 函 数 人 负责 构造 HTTP 应 答 报 文 。 最后， 只 要 通过 贪 
接 字 将 应 答 报 文 发 送 至 客户 端 就 万 事 大 吝 了 ! 

味 ! 这 段 路 真是 跑 得 气喘 吁 上 时， 和 硕 望 你 还 能 跟 得 上 我 们 的 脚步 。 回 顾 一 下 一 路 攒 下 的 代码 ， 
还 不 算 赖 一 一 毕 葛 这 还 只 是 一 个 最 为 简陋 的 HITP 服 务 硕 。 

不 过 记 这 学 邯 于 竹 征 介 得 的 ; 有 了 gen_ web_server 行 为 模式 ,给 缓存 应 用 添加 HTTP 接 口 可 不 就 
是 小 菜 一 人 碟 儿 了 嘛 ! 毕竟 这 才 是 我 们 目 11.2 节 以 来 的 主要 目标 。 只 需要 创建 一 个 gen web _server 
行为 模式 实现 模块 ， 再 定义 几 个 负责 与 缓存 应 用 进行 交互 的 回调 函数 就 功德 圆满 了 。 不 过 首先 ， 
我 们 不 妨 移 来 看 看 REST 到 撒 是 什么 意思 ，REST 式 的 接口 又 是 什么 样子 的 。 









































11.2.3” 初 识 REST 


REST 即 表征 状态 转移 ( representational state transfer )。 这 个 概念 总 结 了 HTTP 中 的 知 干 已 成 
为 既成 事实 的 核心 思想 。 这 些 思想 并 不 局 限于 HTTP， 但 HTTP 的 支持 极为 广泛 ， 而 且 还 提供 了 
GET、PUT、POST 和 DELETE 等 一 整套 为 人 所 熟知 的 状态 处 理 操 作 和 状态 迁移 操作 。 不 费 吹 灰 之 力 
我 们 就 可 以 将 这 几 个 动词 映射 成 数据 库 的 CRUD 操 作 ， 这 就 大 大 简化 了 HTTP 绥 存 接口 的 设计 。 














表征 状态 转移 

REST 的 关键 原则 是 资源 由 服务 器 持 有 ， 每 个 资源 都 有 一 个 对 应 的 全 局 标识 符 (URI )， 客 
户 端 采用 标准 接口 与 资源 的 表述 形式 (文档 ) 进行 协作 。 也 就 是 说 ,客户 端 获 取 到 的 只 是 资源 
的 表述 形式 ,而 非 资 源 本 身 。 所 谓 资 源 ， 可 能 只 是 一 个 抽象 概念 ， 比 如 “此 刻 我 窗外 的 景色 ”。 
我 们 可 以 用 各 种 格式 来 表述 资源 (比如 JPEG、PNG 或 TIFF 等 )。 0 求 都 会 导致 客户 端 状 
态 的 迁移 , 这 和 你 在 网 站 上 点 击 浏览 网 页 是 一 个 道理 ,文档 内 通常 还 会 包含 指向 其 他 资源 的 标 
识 符 ， 比 如 指向 其 他 HTML 页 面 的 链接 。 

这 里 有 一 个 要 点 必须 注意 , 那 就 是 服务 器 不 应 该 在 自身 状态 中 保存 任何 与 客户 端 相 关 的 隐 
含 信 息 : 状态 信息 要 么 保存 在 客户 端 ， 要 么 以 可 寻 址 资源 的 形式 显 式 保存 在 服务 器 端 。 有 些 人 

会 觉得 不 管 是 什么 遗留 系统 ， 只 要 套 上 _- 层 HTTP 接口 就 能 自封 为 REST 风格 , 这 最 后 一 
条 原则 彻底 否定 了 这 种 想法 。 


REST 式 接口 与 与 Simple Cache 的 交互 很 简单 ,只 会 用 到 3 个 HTTP 动 作 : GET、PUT 和 DELETE。 
不 过 你 必须 确切 定义 每 个 动作 分 别 对 应 于 哪个 缓存 操作 。 最 简单 的 就 是 DELETE， 提 供 资 源 名 称 
即 可 ， 无 须 另行 收发 其 他 数据 : 


DELETE /key HTTP/1.1 


这 一 请 求 最 终 会 调用 simple_cache:delete(Key) ， 从 绥 存 中 清除 由 请 求 报 文 指 定 的 键 。 该 请 











图 灵 社 区 会 员 for(;;)(13433955876@163.com) 专 享 尊重 版 权 


11.2 ”打造 一 套 全 新 的 Web 接口 249 


求 的 应 答 永 远 都 是 "200 oOK" ， 且 应 答 报 文 不 含 消息 正文 。 

GET 要 略为 复杂 一 些 : 

GET /key HTTP/1.1 
处 理 这 一 请 求 时 需要 调用 simple_cache:1ookup (Key) 完成 查找 操作 。 如 采 找 不 到 ， 就 回复 
"404 Not Found" ， 消 息 正文 为 空 ; 如 果 找 到 了 了， 就 回复 "200 oK" ， 消 息 正 文 就 是 从 缓存 中 查 
到 的 值 ( 需要 转换 为 纯 文本 格式 )。 

最 后 是 PUT。 请 求 报 文 的 消息 正文 中 包含 需要 存 人 缓存 的 值 : 

PUT /key HTTP7 1 .1 
处 理 这 类 请 求 时 ， 需 要 调用 simple_cache:insert (Key，Bodqy) 。 请 求 的 应 答 永 远 都 是 "200 
OK" ， 且 消息 正文 为 空 。 

就 这 么 多 了 。 对 于 这 样 一 个 简单 应 用 ， 很 容 匈 就 可 以 看 出 它 的 接口 的 确 符合 REST 的 原则 : 
每 个 资源 〈 绥 存 中 的 条 目 ) 都 有 自己 的 URL， 只 用 基本 的 HITP 操 作 来 操纵 资源 ， 整 套 接 口 也 不 
涉及 任何 跨 请 求 的 客户 端 状态 信息 。 下 一 节 ， 我 们 将 以 先前 搭建 的 gen_web_server 为 基础 来 实现 
这 僚 协 议 。 


























11.2.4 ”用 gen_web_server 实 现 REST 式 协议 


和 11.1.2 节 中 的 tcp interface 一 样 ， 我 们 的 REST 式 HTTP 接 口 http interface 也 是 一 个 独立 的 主 
动 应 用 ， 带 有 目 己 的 application 行 为 模式 模块 和 顶层 监督 者 。 监 督 者 只 有 一 件 事 情 要 做 ， 局 
动 一 个 gen_web_server 行 为 模式 容 融 的 实例 。 应 用 的 目录 结构 如 下 : 


http interface 





| = 一 名 bin 
| `-- http interface.app 
=~- SEC 

|-- hi_app.erl 

|-- hi_server.erl 

‘-—- hi_ sup.erl 


对 你 来 说 ， 编 写 .app 文 件 、 app 模 块 还 有 _sup 模 块 应 该 早 就 不 是 问题 了 了。 重点 在 于 _sup 模 块 
的 监督 策略 ， 此 处 采用 的 是 普通 一 对 一 监督 ( 而 不 是 简易 一 对 一 ); 而 且 hi_server:start_link/1 哨 数 
只 启动 了 一 个 子 进程 ， 该 进程 还 是 permanent 型 ( 而 不 是 temporary 型 )。 注 意 ，hi server 模 块 
对 外 屏蔽 了 应 用 内 部 的 实现 细节 ， 只 有 它 才 知道 内 部 的 功能 逻辑 是 基于 gen_ web server 实 现 的 。 

为 了 简化 端口 号 的 配置 ， 可 以 仿效 代码 清单 11-1 中 的 ti app 模 块 ， 在 hi app 模 块 的 start/2 
国 数 中 尝试 用 application:get_env/2 来 谈 取 端口 号 〈 不 过 矢 接 字 可 不 能 在 这 儿 打 开 )。 如 果 
找 不 到 对 应 的 配置 项 ， 请 采用 默认 端口 号 。 为 了 避 倪 与 trp_interface 的 1155 吕 端口 相 冲 突 ， 这 次 
我 们 选用 1156 作 为 默认 端口 号 。( 愿意 的 话 ， 你 也 可 以 采用 这 种 方法 来 配置 了 地 址 ; 当然 ， 人 简单 
起 见 ， 暂 时 采用 默认 IP 地 址 也 没 问 题 。) 我 们 相信 ， 你 一 定 能 够 凭借 自己 的 能 力 完 成 这 些 工作 。 

该 应 用 的 结构 如 图 11-4 所 示 。 此 处 最 为 关键 的 模块 就 是 hi_server, 正 是 它 基 于 gen_web _server 
行为 模式 实现 了 真正 的 REST 式 HTTP 接 口 。 该 模块 的 代码 参见 代码 清单 11-8。 
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| hi app.erl 
PE 
gen web server 
gen connection sup 
hi server.erl 
(gen web server 
回调 模块 ) 


— te) 


图 11-4 ”REST 式 接口 应 用 的 结构 。 顶 层 监督 者 hi_sup( 由 hi_app 启 动 ) 只 有 一 个 。 
该 进程 与 其 自身 的 子 进程 一 起 ， 构 成 了 一 个 以 hi_ server 为 回调 模块 的 
gen web_server 行 为 模式 的 实例 








代码 清单 11-8 hi server.erl 


-module{hi server) . 





-behaviour (gen wepbp_SsetrveLt ) . 


-export([start lJink/1, start link/21}). 


%% gen Web server callbacks 
-export([init/l1, get/3, delete/3, put/4, post/4, 
head/3, options/4, trace/4, other methods/4]). 





start link{({Port}) -> 
gen web server:start link(?MODULE, Port, [1}. 


start link{IP, Port}) 一 > 
gen web server:start lJink(?MODULE, IP, Port, [|]). 








get{({{http request, 'GET', {abs path, <<"/",Key/bytes>>}, _}, 
_Head, UserData) 一 > 处 理 GET 请 求 
case simple cache: lookup (Kev) of 
{ok, Value} 一 > 
gen web server:http reply(200, [], Value)}):; 
{error, not found} 一 > 








gen web server:http reply(404, Sorry, no such key.”") 








end. 
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deletelltiLtip reouest,: "DELETE', {labs path, "7/7" Bev/ bvtesss),; 三 请 处 理 DELETE 
_Head, UserData}) 一 > 请 求 
simple cache:delete (Key)}, 


gen web server:http reply (200). 
put ({http_ request, ‘PUT', {abs_ path, <<"/",Key/bytes>>}, _}, A 处 理 PUT 请 求 
_Head, Body, UserData}) -> 
simple cache:insert (Key, Body)}), 
gen web server:http reply(200). 





Post ( Regquest, Head, Body, USerData) 一 > 
Genm_web_Sserver:nttp_repDpLYyt501) . 








head!( Reduest， Head, UserData}) 一 > 
den web server:http reply(501). 





| 其 余 方法 一 律 回 复 "501 
OPptlions!( Request, _Head, _PBody, _UserData) -> Not Implemented" 
den _ web server:http reply(501). 





trace( Redquest, _Head, _Body, _UserData) -> 
gen web server:http _ reply(501) . 





other methods{ Regquest, _Head, _PBody, _UserData) -> 
gen web server:http reply(5S501). 


大 功 告 成 ! 在 gen web server 行 为 模式 上 耗费 的 精力 终于 有 了 回报 : 有 了 它 , 实现 这 类 HTTP 
服务 大 简直 不 费 吹 灰 之 力 。 和 gen server 实 现 模 块 类 似 ，hi server 同 样 具 1 备 behaviour 声 明 、 回 
调 函 数 导出 表 ， 以 及 厂 J 实例 的 API 函 数 。 在 本 例 中 ， A 1ink 消 数 需 
要 一 个 参数 来 指明 端口 号 ， 该 参数 传 日 hi sup。 同 时 请 注 半 ,这 两 个 函数 还 问 
gen web server:start link() 0 了 递 了 一 一 个 用 作 UserArgs 参 数 的 空 ;列表 束 这 个 服务 可 实现 
而 言 ， 这 个 参数 派 不 上 用 场 。 

每 当 有 新 连接 到 来 时 ，gen_web_server 就 会 调用 init/1 回 调 来 初始 化 user_qata 字 上段。 
用 户 传 给 gen web server:start 11nK( ) 的 UserArgs 参 站 会 被 原封 不 动 地 传递 至 init/1， 
因此 这 个 服务 天 的 输入 参数 就 是 一 张 空 表 。 不 过 这 个 简单 的 服务 需 根 本 就 没有 用 到 
gen_web_server 的 user_data 功 能 ， 因 此 init/1 返 回 的 也 是 一 张 空 表 。 

在 整 侠 协议 实现 之 中 ， 最 为 关键 的 还 是 get 、delete、put 这 3 个 回调 。3 个 孔 数 利用 二 进 制 
模式 匹配 (参见 2.10.2 方 ) 提取 出 了 URI 中 的 键 ( 去掉 开头 的 斜 杜 即 可 )。 人 简洁 起 见 ， 本 例 中 的 键 
和 值 仪 限于 内 容 为 纯 文本 的 二 进 制 串 。 虽 然 绥 存 中 也 可 以 存储 其 他 类 型 的 Erlang 项 式 ， 但 该 接口 
不 子 文 持 ; 尤其 需要 注意 的 是 ， 当 simple_cache:1ookup (Key) 调 用 成 功 时 ， 查 得 的 值 也 必须 
是 二 进 制 串 、 学 符 串 或 0 列表， 否则 服务 器 无 法 通过 套 接 字 发 送 应 答 

在 处 理 cET 请 求 时 人 @， 如 果 能 在 缓存 中 查 到 给 定 的 键 ， 查 得 的 值 便 会 作为 ,200 OK" 应答 的 
消息 正文 返回 给 客户 端 ; 否则 就 返回 消息 正文 为 空 的 "404 Not Foungd" 应 答 。DELETE 请 求 @ 比 
较 简 单 : 删 完 给 定 的 键 后 回复 "200 OK" 即 可 。PUT 请 求 候 也 复杂 不 到 哪儿 去 ， 它 的 作用 是 将 URI 
中 的 键 和 请 求 消息 正文 中 的 值 存 人 缓存 。( 请 注意 ，put 回 调 需 要 Body 参 数 ，get 和 delete 则 不 
需要 。) 至 于 其 余 的 HTTP 方 法 @， 统统 返回 "501 Not Implemented"。 

我 们 还 可 以 给 应 答 报 文 添加 更 为 丰富 的 协议 头 ， 不 过 HTTP 协 议 头 使 用 规范 的 详情 已 经 超出 
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了 本 书 的 讨论 范 明 。 需 要 (或 应 该 ) 包含 哪些 附加 信息 ， 很 大 程度 上 是 取决 于 应 用 场景 的 。 

来 试 试 Simple Cache 的 HTTP 接 口 吧 。 前 先 请 采用 以 下 命令 编译 源码 。 为 了 让 编译 带 检 查 
hi server 模 块 是 否 正 确实 现 了 gen web server 行 为 模式 的 接口 ， 我 们 给 erlc 命 令 加 上 了 
gen web server 的 .beam 文件 路 径 : 


erlc -pa ./gen web server/ebin -o ./http interface/ebin 
./http interface/src/*.erl 


请 按 11.1.5 市 中 给 出 的 方法 启动 系统 (还 可 以 同时 启动 tcp_interface 应 用 )， 然 后 在 系统 shell 
中 调用 application:start (http_interface)。 操作 完毕 后 ， 可 以 用 Appmon 检 查 应 用 的 运行 
状况 。 

自 完 , 利用 curl 发 起 PUT 请 求 ， 以 xyzzy 为 键 将 文件 put.txt ( 创建 于 11.2.1 方 , 文件 内 容 为 单词 
Erlang ) 上 传 至 缓存 服务 带 ， 然 后 再 用 GET 请 求 查询 同一 个 键 : 


S$ curl] -TT put.txt http://localhost:1156/xyzZzZYy 
$ curl http://localhost:]]56/xyzZzZy 
Erlang 


确实 管用 ! 不 妨 用 TCP 接 口 查询 同一 个 键 试 试看 。 不 过 由 于 HTTP 接口 只 认得 二 进 制 串 ， 这 
次 得 换 用 二 进 制 串 来 表示 : 

1ookup [<<"xyzzya>>] 

OK: {ok, <<'"Erlang\n">>}. 


如 果 想 改进 这 套 接 口 ， 可 以 考虑 从 存 取 任意 Erlang 数 据 入 手 。 男 外 ， 在 处 理 PUT 请 求 时 ,不 
但 可 以 保存 消息 正文 ， 还 可 以 在 缕 存 中 保存 消息 正文 的 content-type。 这 样 一 来 就 可 以 给 GET 
请 求 的 应 答 报 文 加 上 对 应 的 content-type 了 。 














11.3 ”小结 


现在 外 部 的 客户 端 可 以 通过 两 种 不 同 的 协议 与 Simple Cache 应 用 集成 : 一 种 是 目 定 义 的 、 基 
于 TCP 的 文本 协议 ， 一 种 是 基于 标准 HTTP 的 更 为 结构 化 的 REST 式 协 以 。 这 一 路 上 ， 我 们 不 仅 擎 
握 了 用 Erlang 开 发 并 发 TCP 服 务 需 的 大 二 关键 技能 ， 还 学 会 了 如 何 创 建 自 定义 行为 模式 ， 顺 便 还 
学 了 一 点 儿 HTTP。 如 今 ， 生 产 环 境 中 多 语言 、 多 平台 共存 的 情况 日 益 普遍 ， 你 在 本 章 中 作出 的 
努力 成 功 拓 展 了 Simple Cache 的 应 用 场景 ， 把 它 推 名 了 Erlang 以 外 的 世界 。 

下 一 章 ， 我 们 将 会 展示 让 Erlang 直 接 与 其 他 语言 开发 的 程序 进行 交互 的 方法 ， 从 而 达成 比 
TCP/IP 更 为 紧密 的 集成 。 











图 灵 社 区 会 员 for(;;)(13433955876@163.com) 专 享 尊重 版 权 





用 端口 和 NIF 集 成 外 围 代码 


本 章 概要 

口 端口 、 链 入 式 驱 动 ， 和 原生 曙 数 (Natively Implemented Functions，NIF ) 
加 EC 

口 用 NIE 集 成 C 库 





现 如 今 , 我 们 的 缓存 应 用 已 经 十 分 强大 了 ,日志 、 多 节点 分 布 式 文 择 、 自 动 化 集群 接 和 人 ， 等 
等 ， 统 统 不 在 话 下 。 它 不 仅 提 供 了 用 于 存 取 二 进 制 数 据 的 REST 式 HTTP 接口 ， 还 提供 了 较为 简陋 
但 却 可 以 存 取 任意 Erlang 项 式 的 TCP 文 本 接口 。 总 体 来 讲 ，Erlware 的 同仁 们 颇 为 满意 。 再 接 再 历 ， 
如 采 能 通过 HTTP 接 口 来 存 取 结 构 化 数据 ， 己 不 更 妙 ?” 当 然 ， 我 们 应 该 采用 标准 的 数据 格式 ， 而 
日 最 好 不 要 让 客户 问 操 心 序 列 化 、 反 序列 化 等 事务 。Erlware 若 望 你 能 进一步 扩展 现 有 的 REST 式 
API, 使 它 能 够 支持 JSON ( JavaScript Object Notation，JavaScript 对 和 象 标 记 ) 格式 的 数据 存 取 。( 详 
情 请 参见 www.json.orfg。 另 外 请 注意 , 为 了 与 YAL 中 的 术语 保持 一 致 , 在 本 章 中 我 们 统一 将 JSON 
对 象 称 作 映射 。) 

他 们 打算 采用 名 为 YA 开 的 开源 JSON 库 来 实现 JSON 文 本 和 Erlang 项 式 间 的 相互 转换 。YAJL 
库 用 C 写 成 , 是 类 似 于 SAX 的 回调 式 解 析 郝 。 利 用 它 , 无 须 借 助 任何 中 间 格 式 就 能 把 JSON 字 符 串 
解析 成 所 需 的 Erlang 项 式 。 最 新 版 本 的 YAJL 可 从 http:/lloyd.github.conyyajl/ 获 取 。 还 可 以 在 
GitHub.com 上 找到 一 个 可 与 本 书 其 余 代码 配套 使 用 的 版 本 ( 请 到 GitHub 上 搜索 Erlaneg and OTP 
in Action )。 

之 所 以 选择 YAJL， 是 因为 我 们 认为 解析 JSON 这 样 的 标准 格式 最 好 还 是 选用 久 经 考验 的 库 ， 
浪费 精力 目 己 造 轮子 不 人 得。 另外 , 与 C 库 进行 交互 也 有 一 定 的 开销 , 小 段 JSON 文 档 的 解析 并 不 
比 纯 Erlang 快 多 少 。 慌 代 只 有 在 解析 大 型 文档 (比如 内 含 数 兆 字 节 Base64 编 码 数 据 的 文档 ) 时 ， 
这 个 方案 才能 发 挥 出 优势 。 同 时 ， 我 们 还 会 介绍 Erlang 与 外 界 交 互 的 通用 机 制 。 

与 大 部 分 编程 语言 一 样 ，Erlang 也 允许 你 与 其 他 语言 写成 的 代码 进行 交互 ， 不 过 它 提供 的 标 
准 机 制 着 实 有 点 儿 特 别 。 大 部 分 语言 都 目 市 一 套 外 于 函数 接口 (Foreign Function Interface， 人 简称 
FFI )， 用 于 在 宿主 语言 中 链接 和 调用 C 代 码 。Erlang 则 别出心裁 地 扩展 了 消息 传递 机 制 ， 拿 它 ; 
实现 与 外 围 代码 的 交互 。 在 Erlang 代 人 码 看 来 ， 外 围 代码 的 行为 和 独立 的 Erlang 进 程 没 有 什么 两 样 : 
外 围 代 码 同 样 可 以 收发 Erlang 消 上 朋 。 外 围 代码 在 Erlang 中 以 并 口 的 形式 出 现 。 所 请 端口 ， 就 是 一 
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种 类 似 于 Erlang 进 程 的 对 象 ( 参见 2.2.7 节 )。 

除 此 以 外 ， 还 可 以 利用 Erlang 的 分 布 式 机 制 来 集成 外 围 代码 。Erlang/OTP 自 市 两 个 库 ， 分别 
是 C 库 Erl Interface( 简称 为 ei ) 和 Java 库 Jinterface 一 一 利用 这 两 个 库 可 以 写 出 能 够 乔装 成 Erlang 
节点 的 程序 。 对 于 真正 的 Erlang 方 点 ( 即 运 行 在 分 布 式 模 式 下 的 Erlang VM ) 而 言 ， 这 些 外 围 程 
友和 别 的 厄 点 没有 什么 区 别 一 一 它们 有 节点 名 ， 而 且 也 都 避 循 Erlang 的 分 布 式 通信 协议 。 不 过 
JSON 文 档 解 析 这 类 任务 还 用 不 着 创建 C 节 点 (或 Java 市 点 )， 否 则 未 免 也 太 兴 师 动 众 了 。 我 们 将 
在 第 13 章 中 详细 介绍 用 Jinterface 创 建 外 围 节 点 的 方法 。 

最 后 一 种 集成 手段 就 是 原生 图 数 (NIF )， 和 本 书 一 样 ， 它 也 才刚 刚 诞 生 不 入。 利用 NIF 可 以 
创建 出 类 似 于 Erlang 内 置 郴 数 ( BIF ) 的 图 数 。 这 些 困 数 各 目录 属于 某 个 特定 的 Erlang 模 块 ， 里 然 
用 C 和 erl_nif 库 开发 而 成 ， 它 们 的 调用 方法 却 和 普通 Erlang 上 因数 一 般 无 二 。 在 3 种 集成 手段 之 中 ， 
NIF 的 通信 开销 最 小 ; 然而 NIF 代 码 一 旦 出 现 问题 ， 整 个 Erlang YM 都 有 可 能 会 跟着 宕 机 。 因 此 和 二 
万 不 要 滥用 NIF， 使 用 之 前 务必 要 好 好 扩 量 一 下 。 下 面 我 们 先 介绍 端口 ， 然 后 再 介绍 NIF。 
































12.1 痪 口 和 NIF 


在 Erlang 的 各 种 对 外 交互 方式 中 ， 剃 口 是 最 为 传统 也 最 为 基本 的 一 种 。 其 中 又 以 普通 闪 口 了 最 
为 何 单 优雅 ， 同 时 它 还 在 Erlang 代 码 和 外 围 代码 之 间 筑 起 了 一 违 关键 的 隅 离 市 ， 人 性 能 方面 一 般 情 
况 下 也 还 过 得 去 。 此 外 ， 病 口 与 开发 合 言 无 天 : 任何 语言 都 可 以 用 于 亲 口 外 围 程序 的 开发 。 如 末 
拿 不 准 该 采用 哪 种 方式 , 那么 不 妨 完 用 端口 编写 一 个 简单 版 本 , 待 后 续 发 现 需要 提升 性 能 时 再 做 
优化 也 不 述 。 

端口 以 消息 传递 为 基本 通信 形式 。 要 想 在 Erlang 中 辐 端 口 背后 的 外 围 代 码 发 送 数据 ， 请 按 以 
下 格式 加 站 口 发 送 消息 : 

PortID ! {self(}, {command, Datal}} 

其 中 Data 既 可 以 是 二 进 制 串 也 可 以 是 IO 列 表 ( 即 多 层 骸 倒 的 字 市 列表 和 /或 二 进 制 串 列表 )。 
请 注 划 ， 消 旦 中 必须 市 上 妆 口 属 主 进程 的 pid， 属 主 进程 通常 就 是 当前 进程 ,但 其 实 只 要 知道 了 
端口 DD 和 属 主 进 程 的 pid， 任 何 进 程 都 可 以 给 妆 口 发 消 恩 。( erlang 模 块 还 提供 了 一 批 可 以 越过 所 
有 权 下 接 操 控 闪 口 的 B 正 函数 ， 但 在 此 我 们 只 讨论 消息 传递 方式 。) 

在 回 Erlang 发 送 源 目 外 于 代码 的 数据 时 ， 奖 口 会 将 数据 封 净 成 以 下 格式 的 消息 ， 腊 步 发 送 给 
端口 的 属 主 进程 : 

{PortID, {data, Data}} 

创建 问 口 时 可 以 指定 多 种 选项 。 选 项 不 同 ，Dpata 字 段 的 格式 也 会 有 所 不 同 。 篆 见 的 如 二 进 
制 串 或 字 节 列表 。 此 外 , 还 可 以 让 奖 口 按 固 定 大 小 分 其 发 送 数 据 ,， 采用 纯 文 本 协议 时 则 可 以 选择 
按 行 发 送 数 据 。 

端口 分 为 两 种 : 其 中 普通 端口 执行 的 外 围 代码 都 是 运行 于 Erlang VM 之 外 的 外 部 程序 。 这 些 
外 部 程序 都 是 独立 的 操作 系统 进程 ， 通 过 标准 输入 和 标准 输出 与 Erlang 区 互 。 包 括 shell 脚 本 在 内 
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的 任何 程序 ， 只 要 能 够 在 箱 主 操作 系统 下 运行 ， 并 采用 标准 输入 和 标准 输出 来 完成 任务 ,都 可 以 
被 普通 端口 调用 。 

以 下 示例 可 在 Erlang 中 运行 操作 系统 命令 secho 'Hello world!': 

Port = open port({spawn, "echo 'Hello world!'"”"}, [|]}. 
(打开 端口 的 方法 留 得 12.2 市 讨论 。) 端口 发 回 的 数据 如 下 : 

{#Port<0.512>, {data,"'Hello world!'‘\n"}} 

有 些 可 执行 程序 无 法 直接 通过 标准 输入 /输出 和 Erlang 交 互 ， 这 时 就 必须 通过 shell 脚 本 或 C 程 
序 来 进行 适 配 。 不 过 大 部 分 UNIX 程 序 可 以 直接 为 Erlang 所 用 。 

在 使 用 普通 端口 时 ， 最 坏 的 情况 无 非 也 就 是 外 围 程序 月 演 导 致 端口 关闭 ; Erlang VM 丝 毫 不 
会 受到 影响 。 在 这 种 情况 下 ，Erlang 代 码 完全 可 以 检测 到 异常 并 采取 相应 的 措施 ， 比 如 重启 外 围 
程序 等 。 

男 一 种 端口 采用 的 是 链 入 式 驱 动 , 通 销 叫 做 端口 驱动 。 顾 名 思 义 , 链 入 式 驱动 是 个 可 被 Erlang 
VM 动态 加 载 和 链接 的 共享 库 ， 通 常用 C 开 发 而 成 。 它 的 优点 是 通信 效率 高 ; 但 和 NIF 一 样 ， 链 入 
式 驱 动 有 可 能 导致 整 个 Erlang VM 的 骨 淄 。 和 普通 并 口 一 样 ， 链 入 式 驱 动 也 以 字 市 为 单位 进行 通 
信 ; 站 在 Erlang 代 人 码 的 角度 看 ， 两 种 并 口 完全 一 样 。 因 此 ， 如 来 普通 亲口 不 够 用 ， 将 之 升级 成 链 
和信 式 驱动 可 谓 易 如 反 筝 。 

这 两 种 端口 便 是 本 章 的 主题 , 我 们 将 逐一 介绍 它们 的 使 用 方法 和 应 用 场景 。 只 有 掌握 了 它们 
的 优 和 缺点， 你 才能 够 在 自己 的 系统 环境 下 作出 正确 的 选择 。 





























12.1.1 普通 端口 


在 Erlang 中 ,端口 是 最 简单 也 最 为 常见 的 外 围 代码 通信 和 手段。 这 类 对 象 脚 踏 两 条 船 : 一 只 脚 
踩 着 Erlang， 另 一 只 脚 踩 着 操作 系统 。 在 Erlang 这 边 ， 端 口 和 Erlang 进 程 差 不 多 : 先 创建 青 使 用 ， 
利用 普通 消息 传递 进行 通信 , 最 终 叉 会 在 某 个 时 刻 消 亡 。 创建 出 的 每 个 端口 都 融 有 一 个 永 不 回收 
的 唯一 标识 符 。 端 口 本 吴 无 法 执行 任何 Erlang 人 代码， 但 每 个 妆 口 和 都 隶属 于 一 个 Erlang 进 程 ， 它 就 
是 这 个 端口 的 属 主 。 并 口 会 把 从 外 界 收 到 的 数据 发 送 给 属 主 , 数据 的 处 理 方式 由 属 主 决定 。 打 开 
端口 的 进程 将 成 为 端口 默认 的 属 主 , 利用 BIF erlang:port_connect/2 可 以 将 所 有 权 转 移 给 其 
他 进程 。 属 主 进程 一 旦 终止 ,并口 便 会 随 之 自动 关闭 。 

从 操作 系统 的 角度 来 看 , 普通 端口 无 非 就 是 运行 在 操作 系统 中 的 另 一 个 程序 ， 只 是 标准 输入 
和 标准 输出 与 Erlang VM 对 接 在 了 一 起 而 已 。 即 便 程 序 表 尘 ，Erlang 也 检测 得 到 ， 并 且 随 时 可 以 
采取 重启 等 措施 。 外 围 程序 在 独立 的 地 址 空间 内 运行 ， 只 能 通过 标准 IO 与 Erlang 交 互 。 因 此 无 论 
外 围 程序 如 何 “ 撒 野 ”, 运行 中 的 Erlang 系 统 都 不 会 受 其 影响 而 前 溃 。 考 虑 到 外 围 代码 潜在 的 危险 
性 ， 这 无 疑 是 一 个 巨大 的 优势 ， 同 时 也 是 Erlang 系 统 能 够 在 与 其 他 程序 进行 交互 的 同时 保持 高 度 
稳定 的 原因 之 一 。 如 果实 时 性 要 求 不 高 ， 便 件 驱 动 其 至 也 可 以 如 法 炮制 。 外 围 代码 与 Erlang 的 对 
接 方 式 如 图 12-1 所 示 。 
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操作 系统 





外 围 应 用 


图 12-1 ”Erlang 通过 普通 端口 的 标准 输入 和 标准 输出 与 外 围 代 码 进行 通信 。 外 围 代 码 一 
日 骨 演 ， 端 口 就 会 关闭 

当然 , 天 下 没有 人 免费 的 午餐。 安全 背后 的 代价 是 性 能 。 数 据 必 须 以 字 市 流 的 形式 往返 于 两 个 
进程 之 间 。 为 此 你 得 定义 一 套 字 市 流 协 议 , 并 自行 完成 数据 的 序列 化 和 反 序 列 化 。 需 要 传递 复杂 
数据 时 ,可 以 利用 Erl_Interface ei 库 中 的 子 数 ,但 前 提 是 必须 用 C 作 为 开发 语言 ,与 ei 类 似 , Jinterface 
库 为 Java 程 序 提供 了 Erlang 通 信和 支持 。 至 于 其 他 语言 嘛 ， 就 只 能 目 力 更 生 了 ,或许 Elang/OTP 目 融 
的 IDL 编 译 占 〈IC ) 可 以 派 上 一 些 用 场 。 当 然 ， 应 用 需求 不 同 ， 实 现 策略 也 可 繁 可 人 简 。 以 开关 控 
制程 序 为 例 ， 用 1 表示 开 、 用 0 表示 关 ， 定 义 一 套 字 符 协 议 就 可 以 了 。 


12.1.2” 链 入 式 闯 口 驱动 


从 表面 上 看 ， 链 入 式 驱 动 和 普通 端口 一 模 一 样 : 外 围 代 码 与 Erlang 代 码 之 间 的 通信 也 是 通过 
面向 字 贡 的 消息 传递 来 完成 的 。 然 而 二 者 在 底层 消息 传递 机 制 层 面 却 完全 不 同 。 而 且 链 入 式 驶 动 
运行 于 Erlang VM 之 内 ， 二 者 共享 一 个 操作 系统 进程 空间 。 要 问 个 中 缘由 ， 主 要 还 是 为 了 性 能 。 

这 样 做 也 有 人 负 作 用 一 一 而 且 还 相当 严重 一 一 端口 驱动 一 旦 月 尝 ， 整 个 Erlang 系 统 都 会 宕 机 。 
更 要 命 的 是 ， 用 于 开发 端口 驱动 的 C 语 言 ， 偏 偏 义 将 大 量 错误 检测 和 资源 管理 的 工作 抛 给 了 开发 
者 。 开 发 者 们 都 是 肉体 凡 胎 ， 难 以 妥善 地 处 理 这 些 问 题 。 一 般 来 说 ， 用 C 或 更 为 低级 的 语言 开发 
的 代码 在 稳定 性 上 都 要 略 逊 一筹 ; 仿 偏 这 些 不 够 稳定 的 代码 又 会 直接 链 人 和 人 Erlang VM， 任 何 错误 
都 有 可 能 导致 整个 Erlang VM 宕 机 ， 磁 上 这 种 情况 ，Erlang 中 的 任何 容错 手段 都 回 天 乏术 了 。 链 
入 式 端 口 驱动 的 工作 方式 参见 图 12-2 ( 不妨 与 图 12-1 做 一 下 对 比 )。 

操作 系统 
Erlang VM 
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river ome(, 
C API 呐 数 











图 12-2” 链 入 式 驱 动 和 Erlang VM 在 同一 操作 系统 进程 空间 内 运行 ， 二 者 通过 C API 中 
的 回调 函数 和 缓冲 区 完成 数据 传输 
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总 之 请 并 记 一 点 ,使 用 链 入 式 驱 动 就 是 在 拿 安 全 换 速 度 。 除 非 系统 的 确 对 速度 有 所 可 求 , 否 
则 不 要 轻易 做 出 妥协 。 详 情 请 参见 第 14 章 中 有 关 性 能 评测 和 优化 的 讨论 。 


12.1.3 ”原生 函数 (NIF) 


NIF 是 Erlang 中 的 新 特性 。 虽 然 在 各 种 外 围 程序 通信 方案 中 ， 端口 最 为 人 简单、 安全 ,但 有 时 
候 我 们 还 是 丸 不 住 去 追求 通信 开销 的 最 小 化 ， 最 好 能 做 到 像 内 置 函 数 一 样 快 。 于 是 ，NIF 内 亮 登 
场 。 它 可 以 帮 你 把 C 滑 数 变 成 跟 BIF 一 样 的 Erlang 哨 数 。 这 种 方式 跟 Java、Python 等 其 他 语言 的 外 
围 量 数 接口 差不多 ， 用 过 这 些 声言 的 话 ， 应 该 就 不 会 感到 阳 生 了 。 不 要 会 错 意 ，NIE 绝 不 应 该 成 
为 你 的 第 一 选择 一 一 想象 一 下 , 一 套 复 杂 系 统 说 表演 就 月 演 , 除了 核心 转 储 文件 以 外 什么 线索 也 
没 留 下 , 那 该 是 多 么 念 怖 的 一 件 事 情 。 如 果 确 定 要 用 NIF, 最 好 先 把 系统 中 的 关键 地 点 与 运行 NIF 
代码 的 节点 隔离 开 来 ， 直 至 NIFE 代 三 在 实战 中 百 炼 成 钢 为 止 。 

NIF 的 男 一 个 根本 问题 在 于 : 原生 困 数 是 在 调用 该 图 数 的 VM 线 程 上 下 文 内 运行 的 ， NIEF 不 将 
控制 权 交 还 给 VM，VM 就 无 法 再 次 调度 该 线程 。 这 个 问题 导 人 至 NIF 只 适用 于 那些 能 够 迅速 返回 的 
也 数 ; 长 期 运行 的 NIE 会 阻塞 Erlang YM 的 调度 人知 。 

总 结 一 下 , 供 Erlang 与 其 他 语言 进行 交互 的 底层 机 制 一 共有 3 种 : 普通 端口 、 链 入 陈 端 口 驱动 
以 及 NIF。 三 者 各 有 各 的 优势 : 普通 端口 既 安 全 又 简单 , 是 一 种 通过 标准 IO 对 接 外 围 程序 的 方法 ; 
链 入 式 病 口 驱动 速度 更 快 , 但 却 牺牲 了 安全 性 ; NIF 可 以 高 次 接 入 库 函 数 ， 同时 风险 系数 也 最 高 。 
在 将 JSON 解 析 库 集成 到 Simple Cache 的 过 程 中 ， 我 们 优先 采用 普通 端口 。 


12.2 ”用 端口 来 集成 解析 器 


任务 已 经 明确 了 ， 我们 要 把 用 C 写 成 的 YAJL JSON 解 析 器 集成 到 Simple Cache 应 用 。 也 就 是 
说 ， 要 按照 上 一 节 中 介绍 的 方法 将 C 库 与 Erlang 进 行 对 接 。 集 成 的 收益 是 双方 面 的 : 既 能 用 上 高 
效 的 解析 库 , 又 不 用 大 幅 修 改 现 有 的 Erlang 代 码 。 集 成 的 工作 量 固然 也 不 小 ,但 却 免除 了 学 习 JSON 
解析 的 成 本 ， 比 起 用 Erlang 写 一 套 全 新 的 解析 融 来 说 还 是 省 力 多 了 。 

在 后 续 章节 中 ， 我 们 还 会 更 进一步 ， 把 普通 端口 改造 成 链 入 式 端 口 驱 动 和 NIF。 因 此 在 设计 
库 的 接口 时 应 尽 可 能 采用 模块 化 的 设计 。 所 竺 我 们 的 API 相 当 简 单 : 输入 JSON 文 档 ， 执 行 解析 ， 
最 后 将 解析 出 的 Erlang 数 据 结构 返回 给 调用 方 即 可 。 

正如 12.1 市 所 述 ， 在 集成 外 围 代码 时 应 优先 考虑 普通 端口 ， 除 非 理 由 充分 ， 否 则 一 般 不 采用 
链 入 式 端口 驱动 或 NIF。 既然 采用 普通 端口 , 就 必须 将 YA 开 库 包装 成 一 个 以 stdin 为 输入 、 以 stdout 
为 输出 的 外 围 程序 ; YA 开 库 是 用 C 写 成 的 ,用 C 来 编写 这 个 外 围 程序 自然 也 最 为 简便 高 效 。 在 集 
成 过 程 中 ， 端 口 创建 、 消 息 发 送 和 端口 数据 处 理 等 功能 将 由 Erlang 代 码 负责 完成 。 这 部 分 代码 比 
较 简 单 ， 而 且 可 以 很 好 地 演示 端口 通信 ， 我 们 不 妨 先 从 此 处 人 手 。 



















































































12.2.1 Erlang 方面 的 端口 


我 们 曾 在 12.1.1 市 中 说 过 ， 每 个 珊 口 都 隶 属于 一 个 Erlang 进 程 ( 即 端 口 的 属 主 进程 )， 病 口 输 
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出 的 数据 最 终 都 会 进入 属 主 进程 的 信箱 。 属 主 进程 一 旦 终止 ， 端 口 就 会 关闭 。 由 此 可 见 ， 端 口 的 
管理 并 不 复杂 ; 既然 本 书 的 主题 是 Erlang/OTP ， 我 们 不 妨 采 用 gen_server 来 实现 端口 管理 功能 。 
此 处 我 们 只 节选 了 部 分 关键 代码 ， 其 余 内 容 就 不 一 一 罗列 了 了 。gen_server 已 经 是 你 耳熟能详 的 模 
块 ， 目 行 补 全 缺失 部 分 应 该 不 成 问题 。 

按照 本 书 中 其 他 示例 的 命名 规则 ,我 们 给 这 个 模块 取 名 为 jp_server( jp 即 JSON Parser 的 缩写 )。 
与 此 相对 应 ， 负 责 管 理 端口 的 服务 规 就 是 与 该 模块 同名 的 本 地 注册 进程 。 为 了 容纳 这 个 模块 ,我 
们 再 创建 一 个 名 为 json_parser 的 应 用 , 为 应 用 补 齐 jp_app 和 jp_sup 模 块 后 , 还 要 编写 一 个 用 于 封装 
jp_server 的 前 并 API 模 块 json parser。 

1. 服务 器 端 API 

首先 从 jp_server API 了 本数 入 手 : 除去 用 于 局 动 服务 融 的 start_link/0 以 外 ， 该 模块 只 有 一 
个 API 国 数 ， 即 parse_qocument/1。 如 下 : 


Darse document {Data) when 1S binary (Data) 一 > 
Gen server:call (?SERVER, {parse document, Datal})}. 


一 如 往常 ， 这 个 API 只 是 对 gen_server 中 特定 也 数 调 用 的 一 个 简单 包装 。 本 例 中 的 服务 器 理 
应 对 所 有 请 求 作出 应 答 , 因此 我 们 选用 了 同步 的 gen_server:call/2。 参 数 Data 是 个 二 进 制 串 ， 
内 含 竺 解析 的 JSON 文 档 。 调 用 parse_document/1 将 促使 qen_server 调 用 nandle_call/3 问 
调 ， 回 调 的 第 一 个 调用 参数 为 {parse_document，Data}。Erlang 与 端口 之 间 的 通信 便 就 此 正 
式 铺 开 。 

2. 在 服务 器 启动 的 同时 打开 端口 

在 介绍 回 端 口传 送 数 据 的 方法 之 前 ， 我 们 先 来 看 看 如 何在 json_server 进 程 启动 的 同时 打开 并 
口 。 这 样 做 是 为 了 让 端口 能 在 第 一 时 间 承 绪 。 这 一 动作 应 放 人 gen server 的 init/1 回 调 。 除 去 其 
他 初始 化 工作 ，init/1 还 应 调用 BIF open_port/2 打 开端 口 并 将 端口 标识 符 存 人 服务 器 状态 ， 
如 下 所 示 : 


Case Code:priv dir(?APPNAME) of 

{error, _} -> 
error logger:format (~w priv dir not found~n", [?APPNAME]}), 
exit (error); 

PrivDir -> 
Port = open port({spawn, filename:join([PrivDir, "jp prog"]}}, 

[binary, {packet, 4}, exit status])}), 

{ok, Statetstate{port=Port}} 






































end 
(此 处 的 APPNAME 宏 被 定义 为 应 用 名 ， 即 本 例 中 的 json_parser，gen_server 的 状态 记录 中 新 增 
了 字段 port。) 上 述 代 码 首先 尝试 获取 应 用 中 priv 子 目录 的 路 径 ， 在 路 径 的 来 尾 亿 加 外 围 程序 名 


j 记 _prog 后 ， 用 调用 open_port ( {spawn,， ProgrampPath}, options) 局 动 外 于 C 程 序 。 下 一 慷 
将 详细 讨论 这 个 C 程 序 。 








注意 0000000000000piwj0000000000000000000 code:priv_ 
dir/1DDOUUDUUUDPprv UUUD 
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应 用 目录 和 代码 路 径 

在 调用 priv_dir/1 等 code 模块 中 的 函数 时 , 它们 会 在 代码 路 径 中 搜索 给 出 的 应 用 名 。 
例如 ， 调 用 priv_ qir(foo) 时 ， 如 果 代 码 路 径 中 包含 .../foo/ebin， 则 priv_dir 函数 会 返 
回 对 应 的 目录 名 .../foo/priv。 对 于 线 上 系统 来 说 ， 应 用 局 动 之 前 会 事先 设置 好 路 径 ， 不 会 造 
成 什么 问题 ; 但 在 自己 的 电脑 上 用 Erlang shell 做 测试 的 时 候 ， 我 们 往往 会 用 erl -pa ./ebin 来 
启动 Erlang。 在 这 种 情况 下 ， 系 统 并 不 知道 该 到 何 处 去 查找 应 用 ， 进 而 导致 priv_dir/1 
无 法 定位 foo 应 用 。 碰 到 这 个 问题 的 时 候 ， 只 需 换 用 erl -pa ../foo/ebin 等 方式 来 启动 Erlang 
就 可 以 了 。 


open_port/2 的 第 二 个 参数 是 一 张 选项 列表 ， 端 口 将 根据 这 些 选 项 来 决定 如 何 处 理 往返 于 
Erlang 和 外 围 代 人 码 之 间 的 数据 。 本 例 中 用 到 的 选项 如 下 。 

D binary 表 示 端 口 发 送 给 Erlang 的 数据 应 采用 二 进 制 串 格式 而 非 字 节 列 表格 式 。 

口 {packet，N} 让 Erlang 在 发 送 给 外 围 代码 的 每 块 数据 前 加 上 一 个 N 字 广 长 的 整数 前 级 (和 N 

可 取信 为 1、2 或 4 )， 用 于 指定 后 续 跟 看 多 少 字 世 。 这 样 做 可 以 在 一 定 程 度 上 简化 C 代 但 。 

D exit_status 表 示 当 外 围 程 序 退 出 时 ， 退 出 状态 码 应 作为 数据 的 一 部 分 发 送 给 Erlang。 

更 多 详情 请 参见 Erlang/OTP 文 档 中 的 erlang:open_ port/2。 

现在 诺 口 已 经 打开 ， 端 口 的 标识 符 也 已 经 仔 人 进程 状态 ， 下 面 我 们 来 看 看 应 该 如 何 处 理 
{parse document, Msg} 请 求 六 

3. 端口 通信 

以 下 代码 负责 回 闪 口 发 送 消 息 并 等 待 应答， 交口 收 到 消息 后 会 转发 给 外 围 代 码 : 


handle call(l{parse document, Msg}, _From, #state{port=Port}=State} -> 
Port 1 {self (), {command, term to_ binary (Msg)}}, 

















receive 
{Port, {data, Data}} 一 > 
{reply, binary_to term(Data), State} 
eng. 


注意 到 此 处 用 到 了 term_to_binary (Msg) ， 该 调用 会 按 Erlang 的 标准 外 部 传输 格式 将 Msg 
编码 成 二 进 制 数 据 。 换 言 之 ， 可 以 癌 外 围 程序 发 送 任意 Erlang 数 据 ， 在 下 一 市 中 你 将 会 看 到 ， 外 
围 程序 可 以 利用 Erl Interface ei 库 来 解码 来 日 Erlang 的 二 进 制 数据 。( 本 例 中 由 parse_ 
document/1 API 函 数 发 送 的 Msg 本 号 怠 是 个 二 进 制 串 。 不 过 没关系 ， 上 述 代 但 能 够 将 任意 Erlang 
项 式 转换 成 可 经 由 端口 传输 的 外 部 格式 。) 

请 求 处 理 完毕 之 后 ， 外 围 程序 会 将 解析 出 的 数据 结构 组 织 成 {Port，{data，Data}} 格 式 
的 消息 发 送 给 正在 等 待 应 答 的 gen_server 服 务 各 ， 也 就 是 端口 的 属 主 进 程 。 外 围 程序 发 送 的 数据 
也 遵循 同样 的 格式 ， 因 此 只 需 调 用 binary_to_term/1 便 可 以 将 之 转换 为 Erlang 项 式 。 

你 可 能 已 经 注意 到 了 ， 这 段 代 码 有 些 踊 跷 。 一 般 来 说 gen_server 的 请 求 处 理 延 迟 应 该 尽 可 能 
低 ; 但 在 处 理 较 大 的 文档 时 ， 这 上 段 代 码 却 有 可 能 要 阻塞 上 好 一 段 时 间 才 能 从 端口 处 收 到 应 答 。 不 
过 对 于 jp_server 来 说 ， 这 倒 不 是 问题 : 本 例 中 的 外 围 程序 一 次 只 能 处 理 一 个 客户 端 ， 因 此 端口 不 
会 面临 并 发 请 求 一 一 但 这 样 一 来 , 哪个 应 答 该 回复 给 哪个 客户 端 ， 其 间 的 对 应 关系 就 必须 由 你 目 
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己 来 维护 了 。 简 单 起 见 ， 我 们 要 求 服务 器 在 端口 通信 完成 前 不 得 接受 新 的 请 求 ,这样 做 实际 上 是 
将 并 发 控制 交 给 了 gen_server (在 集成 便 件 驱动 等 程序 时 这 种 手法 尤为 有 效 ) 因此 ， 这 个 版 本 的 
jp_server 一 次 只 能 解析 一 份 文档 ， 还 不 具备 并 发 处 理 能 

4. 故障 检测 

由 于 在 创建 端口 时 用 上 了 exit_status 选 项 ,外 围 程序 退出 时 服务 硕 会 收 到 一 条 带 外 消息 。 
你 可 以 根据 这 条 消息 来 跟踪 和 管理 外 围 程序 , 壁 如 通过 重新 打开 端口 来 重启 外 围 程序 ,详情 见 下 : 


handle info{{Port, {exit status, Status}}, #state{port=Port}=State} 一 > 
error_logger:format('"port exited with status ~p; restarting'", 
[status])}), 
NewPort = create Port () ， 
{noreply, Statetstate{port=NewPort}}. 


(上 上述 代 码 假设 create_port () 函数 封 狐 了 打开 端口 的 操作 细 廊 。) 

相 较 之 下 ， 男 一 种 方法 可 能 更 为 优雅 ， 那 就 是 把 上 述 的 gen_server 服 务 剖 彻底 改造 成 外 围 程 
厅 的 代理 。 我 们 不 妨 把 服务 如 设置 成 监督 者 省 辖 郊 围 之 下 的 一 个 透明 ( transient ) 子 进程 ; 一 旦 
发 现 外 围 程序 退出 且 状 态 码 不 为 索 ， 就 关闭 服务 需 〈 注 意 服务 需 退 出 时 原因 码 不 能 是 normal )。 
监督 者 发 现 服务 右 异 常 终止 后 , 便 会 日 动 重 启 整 个 服务 冀 ， 外 围 程序 进而 也 会 随 之 重启 。 该 方案 
的 优点 在 于 可 以 复 用 SASL 的 日 志 功 能 和 OTP 的 重启 策略 。 方 案 的 细 方 就 不 在 此 蒙 述 了 ， 不 过 我 
们 或 励 你 按照 这 个 思路 去 做 做 实验 。 
































12.2.2 C 万 面 的 端口 


上 一 节 中 编写 的 Erlang 代 码 要 求 应 用 的 priv 子 日 录 下 放 有 一 个 名 为 jp_prog 的 可 执行 程序 。 现 
在 我 们 就 开始 用 C 语 言 编 写 这 个 程序 。 不 是 C 语 言 达 人 ?” 没关系， 大 部 分 代码 应 该 都 看 得 懂 。 不 
过 要 想 亲 手 实 验 的 话 ， 你 的 机 需 上 必须 装 有 C 编 译 器 ， 比 如 gcc。 至 于 Windows 平 台 ， 不 妨 试 试 
MinGW， 这 是 gcc 编 译 融 的 一 个 移植 版 本 ， 还 附 审 一 组 可 执行 向 单 脚本 和 makefile 的 精简 UNIX 工 
具 套 件 。 

如 本 章 开 头 所 述 ， 这 个 C 程 序 负责 包装 YA 开 库 ， 是 个 独立 的 可 执行 程序 。 它 从 标准 输入 流 中 
读 入 JSON 文 档 ， 调 用 YA 开 进 行 解析 ， 再 通过 Erl Interface ei 库 将 解析 结果 编码 成 Erlang 项 式 ， 最 
后 将 项 式 以 字 节 片段 的 形式 写 人 标准 输出 流 。 整 个 过 程 与 Erlang 端 口 的 要 求 严 丝 合 缝 。 

















要 不 要 用 Erl Interface 

请 注意 ， 用 C 开发 外 围 代码 时 ，Erl Interface 并 不 是 唯一 的 选择 。 因 地 制 宜 才 是 上 策 一 一 
如 果 在 应 用 中 Erlang 与 C 之 间 的 数据 传输 只 涉及 纯 文本 或 成 块 的 字 节 片段 ， 完 全 不 涉及 结构 
化 的 Erlang 数据 ， 那 么 不 妨 选用 一 种 简单 的 面向 字 节 的 协议 ， 再 辅 以 自 定 义 的 编 解 码 策略 。 
Erl Interface 的 优势 在 于 替 你 包办 了 这 些 事务 ， 而 且 端 口 两 边 都 可 以 使 用 Erlang 项 式 。 相 较 之 
下 这 个 方案 更 为 重型 , 但 在 C 代 码 需 要 发 送 复杂 Erlang 项 式 的 情况 下 , 选用 Erl Interface 会 更 
为 省 心 。 
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要 知道 ， 在 存放 Erlang 源 人 码 文 件 的 src 目 录 下 通常 是 不 泥 放 其 他 语言 的 源码 文件 的 。 因 此 ,我 
们 将 C 文 件 放 在 另 建 的 c src 目录 下 。 代 码 清 单 12-1 罗 列 了 c src/jp_prog.c 的 第 一 部 分 ， 主要 是 竺 干 
简单 的 jnclude 语 句 和 一 些 必要 的 声明 。 


代码 清单 12-1 c src/jp prog.c: 声明 部 分 


tinclude <stdlib.h> 
#include <stdio.h> 
#include <string.h> 


#include <ei.h> » Erl_Interface 和 YAJL 的 头 文件 
#include <yajl/yajl parse.h> 








Hdefine BUFSIZE 65536 和 种 析 尖 回放 声 明 
static int handle null{voiqd *ctx); 
static int handle boolean{voiqd *ctx, int boolval}); 
static int handle integer{void *ctx, long integerVal); 
static int handle double(void *ctx, double doubleVal),; 
static int handle_ string(void *ctx, const unsigned char *stringVal, 
unsigned int stringLen): 
static int handle map_key (void *ctx, const unsigned char *stringVval, 





unsigned int stringLen}); 
tatic int handle start map (void *ctx); 
tatic int handle engd maplvoid *ctx): 
tatic int handle start array {void *ctx);: 


tatic int handle _ end array (void *coctx): 


二 二 


tatic yajl callbacks callbacks = { 

handle null, 

handle boolean, 

handle_integer., 

handle double, 

NULL, /* can be used for custom handling of numbers */ 
handle string, 

handle_ start_map, 

handle map_key, 











9 让 YAJL 获 知 回调 


handle end map, 
handle start array, 
handle end array 


” -0 用 于 跟踪 谋 套 数据 结构 
typedef struct container 七 { 

int index; /* offset of container header */ 

int count; /A* number of elements */ 


struct container 七 *next: 
} container tt; 





typedef struct 1{ 
ei_x_buff x; 6 保存 YAJL 解 析 过 程 中 的 状态 


Container 七 xC; 


图 灵 社 区 会 员 for(;)(13433955876@163.com) 专 享 尊重 版 权 


262 第 12 章 用 端口 和 NIF 集 成 外 围 代 三 


char errmsg[256]; 


} state t， 
Hdefine ERR READ 10 
#define ERR READ HEADFER 11 退出 状态 码 


#define ERR_ PACKET_ SIZE 12 

要 使 用 Erl Interface ei 详 和 YA 了 L 库 中 的 函数 和 数据 结构 ， 必 须 先 包含 这 两 个 库 的 头 文 件 @。 
然后 ， 声 明 后 文 将 要 实现 的 回调 函数 ， 逐 一 注 明 函 数 名 和 类 型 签名 ， 以 便 后 续 引用 候 。 接 下 来 ， 
在 yajl_callpbacks 结 构 体 中 填 和 人 刚刚 声明 的 回调 函数 候 ， 以 供 YA 开 后 续 调 用 。 其 中 一 个 字段 
被 置 为 NULL: 该 字段 对 应 的 回调 负责 处 理 整 数 与 双 精 度 浮 点 数 ， 可 用 于 处 理 无 法 放 和 人 长 整 型 的 
大 数 。 

1. 数据 结构 

还 有 一 些 数据 结构 是 供 你 自己 使 用 的 。 首先 就 是 container_t 结 构 体 人 @。YAIL 在 处 理 JSON 
数组 和 键 / 值 对 映射 时 需要 临时 记录 一 些 辅 助 信 息 ，container_t 的 作用 就 是 保存 这 些 信息 。 
JSON 的 这 两 种 数据 结构 都 是 航 僚 结构 ， 因 此 必须 得 找 出 一 种 用 于 表示 藤 套 容 闫 的 方法 ， 这 便 是 
container_t 中 next 字 上段 的 作用 。count 字 有 段 用 于 记录 当前 容 带 中 已 经 处 理 完毕 的 元 素数 
目 一 一 比如 解析 天 正 在 处 理 某 数组 的 第 四 个 元 素 ， 而 该 数组 本 喘 又 是 另 一 个 键 / 信 对 映射 的 第 七 
个 元 素 。 最 后 一 个 字段 indqex 用 于 修订 最 终 的 数据 结构 : 以 JSON 数 组 为 例 ， 在 解析 数组 的 过 程 
中 ， 只 有 解析 到 末尾 时 才能 确定 当前 数组 中 到 底 有 多 少 个 元 素 ， 这 时 应 折 回 正在 构造 的 Erlang 项 
式 的 起 始 人 处 ， 将 元 系 总 数 十 人 项 式 涉 部 ;index 字 上 段 中 记录 的 就 是 最 终 填写 元 条 总 数 的 位 置 。 详 
情 参 见 后 文 。 

第 二 个 数据 结构 是 state_t@@， 用 于 保存 YAL 解 析 右 在 运行 期 间 的 全 局 状态 。 每 个 YA 了 L 回 
调 孔 数 的 首 个 参数 都 是 指 向 该 结构 体 的 指针 (在 YAJL 文 档 中 , 该 参数 被 称 作 context )。 在 Erlang 
中 也 有 类 似 的 做 法 ,比如 gen_server 总 是 将 服务 磊 当 前 的 状态 作为 各 个 回调 函数 的 最 后 一 个 参数 。 
代码 中 定义 的 解析 融 状 态 包含 一 个 指 回 当前 容 表 的 指针 《解析 需 不 处 在 容 需 内 时 指针 为 NULDL ) 
和 一 个 由 Erl Interface ei 库 定义 的 ei_x_buff 结 构 体 ， 下 文 将 用 该 结构 体 来 构造 Erlang 项 式 。( 运 
用 ei_x_buff 时 ，ei 库 会 自动 为 你 构造 的 Erlang 项 式 动态 分 配 内 存 ， 从 而 简化 编程 。) 此 外 ,还 有 
一 个 用 于 报错 的 字符 串 绥 冲 区 。 

2. 数据 读 写 

首先 登场 的 是 负责 处 理 输入 输出 的 代码 。 前 文 曾经 做 过 介绍 ，Erlang 方 面 的 通信 是 通过 标准 
LIO 流 来 完成 的 ， 而 且 收 发 的 数据 包 都 市 有 一 个 按 网 络 字 下 序 〈 大 山 序 ) 排列 的 四 字 世 整数 前 绥 ， 
用 以 指 代 后 续 数 据 的 长 度 。 




































































注意 网 络 字 节 序 

无 论 运行 于 哪个 平台 , 数据 包头 部 用 于 指定 数据 长 度 的 整数 前 组 都 是 按 网 络 字 节 序 ( 大 端 
序 ) 排列 的 。 因 此 代码 必须 能 够 在 任意 平台 上 正确 解读 数据 包 长 度 。 尤 其 需要 注意 的 是 , 千 万 
Pr 


之 所 以 是 这 样 一 种 格式 ,是 因为 打开 端口 时 指定 了 {packet，4} 选 项 , 详情 请 参见 12.2.1 市 。 
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采用 这 一 格式 ， 负 责 解读 数据 包 长 度 的 C 代 码 会 略 显 复杂 ; 但 力 一 方面 ， 读 出 数据 包 长 度 之 后 剩 
余数 据 的 读 取 过 程 可 以 大 大 简化 。 同 理 ， 在 向 Erlang 发 送 数据 时 也 必须 先 按 正确 的 格式 发 送 数 据 
包头 部 长 度 。 发 完 长 度 之 后 ， 剩 余数 据 只 需 一 次 写 操作 便 可 发 送 完 毕 。 代 码 清单 12-2 中 便 是 VO 
处 理 相 关 的 代码 。 


代码 清单 12-2 c src/jp prog.c: 数据 该 写 











static void write packet (char *buf, int sz, FILE *fd) 
| 和 给 出 包 合 头 部 长 度 信息 的 
uint8 t hd[4]; 数据 
hd[0] = {sz >> 24) & Oxff; 
hd[1] = (sz >> 16) & Oxff: 
hd[2] = (sz >> 8) & Oxff: 
hd[3] = sz & Oxff:; 


fwrite(hd, 1, 4, fq}: 


fwrite(lbuf, 1, sz, fd); 
fflush(fd); 
} 


static size _t read bytes (unsigned char *buf, size t max, FILE *fd) 
{ 
S12e tC Tn 将 数据 读 入 缓冲 区 
n = freadibuf, 1, max, fd): 
if ((n == 0) && lfeof (fd}}) { 
exit (ERR READ): 
} 
return nn; 


} 


static void read packet (unsigned char *buf, size t max, FILE *fd) 
{ 
Size 七 n, sz: 
uint8 t hd[4]; 
读 取 数据 头 部 长 度 


n = read bytes(hd, 4, fd}.; 
if (nn == 0 && feof (fd})}) exit (EXIT SUCCESS}.: 
if {nn l= 4) exit (ERR READ HEADER): 
z= (hd[o0] << 24) + {hd[1] << 16) + (hd[2] << 8} + hd[3]; 


if (Sz > max) f{ 
exit (ERR PACKET SIZE); 
了 
n = read bytesibuf, sz, fd): 
if (nn != sz) { 
exit {ERR READ): 
了 
} 


write_packet 子 数 傅 用 于 输出 完整 的 数据 包 ， 其 中 每 个 数据 包 附 带 一 个 四 字 节 长 的 网 络 字 
节 序 整数 前 级， 用 于 指定 后 续 数 据 的 长 度 。 工 具 函 数 *eaq_pytes 伟 用 于 读 取 数 据 并 将 之 填 和 人 组 
冲 区 《〈 最 多 读 取 max 个 字 节 )，read_packet 函 数 伟 用 于 读 取 带 有 长 度 前 绥 的 数据 包 。 请 注意 ， 
谈 写 操作 一 旦 失败 ， 程 序 就 会 以 非 零 状态 码 退 出 。 在 通信 故障 或 协议 不 同步 的 情况 下 , 往往 难以 
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准确 区 分 数据 包头 和 原始 数据 ， 因 此 最 好 还 是 直接 退 出 ， 让 Erlang 重 局 程序 为 妙 。 只 有 当 输 入 流 
恰好 在 JSON 文 档 读 取 完毕 时 关闭 ， 程 序 才 会 正常 退出 。 

3. 运行 JSON 解 析 器 

接收 了 Erlang 方 面 传人 的 文档 并 将 之 存 人 绥 冲 区 之 后 , 就 可 以 初始 化 YA 开 解 析 融 并 开始 解析 
收 到 的 数据 了 。 该 任务 由 parse_json 困 数 负责 (参见 代 人 码 清单 12-3 )。 请 注意 , 该 函数 的 第 一 个 
参数 是 个 指 癌 state_t 结 构 体 的 指针 ; 收 到 该 指针 后 ，YAJL 会 将 它 传递 给 你 定义 的 各 个 回调 也 
数 ， 以 便 它 们 随时 访问 解析 融 的 当前 状态 。 


代码 清单 12-3 c srcjp prog.c: JSON 解 析 


static const char *parse ]SsomnfSstate t *st, unsigned char *buf, size t len,) 
{ 
ya]jl parser config cfg = { 
1], /* allow comments */ 
0 /xx don't check UTF-8 */ 
+ 
yajl handle yh,; 
yajl_status yes; 
Const char *err=NULL.; 


0 初始 化 YAJL 解 析 器 句柄 














yh = yajl alloc(gscallbacks, &cfg, NULL, st); 
ys = yajl_parse(yh, buf, len): 
if (ys == yajl status insufficient data) ( 


ys = yajl parse complete (yh),; 

} 

1f (ys == yajl status insufficient data}) { 
Err = "Unexpected engd of document"; 

} else if (ys != yajl_status ok) { 
unsigned char *msg = yajl get error(yh, 0, NULL, 0); 
strncpy (st->errmsg, (char *}msg, sizeof (st->errmsg)—-1), 
vyajl_free error{(yh, msg): 
st->errmsg[sizeof (st->errmsg}] = 0; 





err = St->errmsg; 
} 9 释放 YAJL 句 柄 
yajl freelyhn) 
return err. 


} 

该 函数 首先 在 开头 处 为 YA 开创 建 了 几 样 东西 : 一 个 配置 信息 结构 体 、 一 个 解析 器 句柄 和 一 
个 用 于 表示 当前 解析 情况 的 变量 。 接 着 ， 调 用 yajl1_alloc 初 始 化 句柄 @， 调 用 参数 包括 代码 清 
单 12-1 中 定义 的 那 套 回 调 另 数 、 配 置信 息 结 构 体 ， 以 及 状态 指针 ( context 变 量 )。 第 三 个 参数 
暂时 设 为 NULL。 句柄 初始 化 完毕 后 便 可 以 利用 该 句 顶 来 调用 yaj1_parse 去 解析 数据 缓冲 区 中 的 
数据 了 。 在 解析 过 程 中 ，YAJL 会 伍 机 调用 你 提供 的 回调 也 数 来 构建 所 需 的 结果 。 解 析 完 成 后 ， 
需要 调用 yajl_free 释 放 人 句柄 人 @。 

如 条 yajl1_parse 的 返回 值 指示 文档 不 完整 ， 则 应 调用 yajl1_parse_complete 告 知 解析 天 
数据 已 经 全 部 处 理 完毕 ; 如 果 仍 旧 显 示 不 完整 ， 则 令 丽 数 返回 ,并 在 错误 信息 中 注 明 文档 的 确 不 
完整 。 如 果 解 析 过 程 出 现 其 他 异常 , 则 调用 yaj1l1_get_error 获 取 错 误 字 符 串 并 将 之 复制 到 解析 
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状态 结构 体 的 字符 串 缓 冲 区 内 ， 然 后 用 yaj1l_free_error 释 放 人 句柄 。 为 了 简化 parse_json 的 
使 用 ， 不妨 对 函数 的 返回 值 稍 作 修 饰 . 解析 成 功 返 回 NULL， 解 析 失 败 则 返回 内 含 错误 信息 的 字 
符 串 。 

4. 用 ei 编 解码 Erlang 项 式 

搞定 这 些 之 后 ,现在 我 们 来 研究 一 下 单个 请 求 包 的 处 理 过 程 。jp_prog 收 到 Erlang 发 来 的 请 求 
包 后 会 将 之 存 人 输入 缓冲 区 。 剩 下 的 工作 便 交 由 process_qata 上 因数 完成 ， 详 情 参 见 代码 清单 
12-4， 其 中 还 包括 一 个 辅助 男 数 make_error。 和 鹤 至 目前 为 止 ， 我 们 只 讨论 了 数据 该 写 和 YAJL 解 
析 需 的 调用 方法 ; 接 下 来 ， 我 们 将 曾 述 如 何在 C 代 码 中 调用 ei 库 处 理 Erlang 项 式 。 


代码 清单 12-4 ec src/jp prog.c: 解析 单个 文档 


static void make error{state tt *st, const char *text) 
{ 


全 1 x freel(&st-—->x).; 




















eli x new with version (&st->x).: 

el x encode tuple header (&st->x, 2).， 
El x encode atom(&st->x, "error'").: 
el1i_ x encode string(&st->x, text).; 


, 


static void process data{lunsigned char *buf) 
{ 
state t st; 


st.c = NULL; -0 初始 化 输出 缓冲 区 


el x new with version(&st.x);: 








int index = 0; 
int ver = 0, type = 0, size = 0; 本 
解析 输入 数据 中 的 版 本 

Ift (ei aecoae_verSsLonlt (char *})buf, &index, &ver)}) { 字 节 

make errorl(&st, "data encoding version mismatch").; 
} else if (ei get type (l(char *}buf, &index, &type, &Size) 

| | type != ERL_BINARY EXT) { 

make error(&st, "data must be a binary");: 
F Sloe 1 对 {ok，...} 的 开头 

el x Encode toplLe header (get xi 21 进行 编码 

el1 x encode atom(&st.x, ok}.: 


Const char *err: 
if ({(err = parse jsSon(&st, &buf[lindex+5], Size}) I= NULL) f{ 
make error(&st, err);: 
} 
} 
write packet (st.x.buff, st.x.buffsz, stdout).; 
ei x freel{&st.x); 


} 

在 对 Erlang 项 式 进行 序列 化 时 ，erlang:term to_binary/1 玉 用 的 正 是 Erlang 分 布 式 协议 
中 的 外 部 项 式 格 式 。 有 关 该 格式 的 详情 请 参阅 标准 Erlang/OTP 文 档 中 的 ERTS 用 户 指南 。 好 在 使 
用 这 一 格式 并 不 需要 关注 字 节 层面 的 详细 表示 方法 一 项 式 的 编 解码 工作 全 权 交 由 ei 库 负 责 妈 
可 。 在 本 例 中 ，Erlang 编 码 完 毕 后 发 送 给 端口 的 项 式 已 经 存 人 输入 缓冲 区 ( 参见 12.2.1 节 )。 该 项 
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式 是 个 内 含 JSON 文 本 的 二 进 制 串 。 

在 对 项 式 进行 解码 并 开始 解析 之 前 ， 首 抑 要 初始 化 解析 融 状 态 ， 尤 其 是 其 中 的 ei_x_buff 
结构 体 人 @， 该 结构 体 将 用 于 构造 最 终 发 回 Erlang 的 解析 结果 。 初 始 化 工作 由 ei_x_new_with_ 
version 完 成 , 具体 来 说 就 是 分 配 一 个 动态 缓冲 区 , 表 在 缓冲 区 的 起 始 处 插入 一 个 版 本 号 。Erlang 
外 部 项 式 格式 要 求 数据 块 在 第 一 个 字 有 处 注 明 编码 方式 的 版 本 号 一 一 其 作用 在 于 确保 各 节点 和 
客户 问 能 够 以 相互 羔 容 的 方式 进行 数据 交换 。 一 般 来 说 ， 版 本 号 到 上 瓜 是 多 少 并 不 重要 ; ei 库 中 的 
函数 会 帮 你 打 理 好 一 切 。 

ei 库 中 的 解码 函数 用 到 了 一 个 缓冲 区 下 标 变 量 ， 它 的 初 值 为 零 ， 并 且 会 随 着 解码 操作 的 推进 
逐步 递增 。 在 解码 输入 数据 时 ， 首 先 应 调用 ei_qecode_version 人 确认 版 本 号 。 如 果 输 入 缓冲 
区 中 的 版 本 号 与 ei 不 莱 容 ， El _ dec ode_version 将 返 回 一 个 非 零 值 这 时 proces s_data 会 癌 
Erlang 发 回 一 个 包含 错误 信息 的 字符 串 项 式 。 如 有 果 人 解码 成 功 ， 解 析出 的 版 本 号 将 被 存 入 变量 ver 
(版 本 号 本 身 在 此 处 没有 意义 )。 

下 一 步 ， 我 们 开始 分 析 藏 在 版 本 号 字 广 之 后 真正 竺 解码 的 项 式 。 具 体 方法 与 上 述 过 程 类 似 : 
首先 调用 si_get_type， 右 返回 值 非 零 则 数据 无 效 ， 否 则 目标 项 式 的 类 型 和 大 小 将 被 分 别人 存 人 
变量 type 和 size (该 国 数 不 会 递增 ;indqex )。 不 出 意外 的 话 ， 得 出 的 类 型 应 该 是 
ERL_BINARY_EXT， 表 示 这 个 项 式 是 个 二 进 制 串 。 此 时 输入 缓冲 区 中 的 内 容 如 图 12-3 所 示 。 


Tolelel 
/ 以 (A 


编码 版 本 二进制 ” 数据 长 度 二 进 制 串 数据 
申 类 型 


图 12-3 ”以 外 部 项 式 格 式 存 入 输入 绥 冲 区 中 的 二 进 制 串 项 式 。 该 格式 的 具体 细节 并 不 
重要 ，ei 库 会 协助 你 完成 解码 工作 

现在 ， 待 解码 的 二 进 制 串 就 位 于 buf [index] 人 处 。 为 了 避免 数据 复制 的 开销 ， 不 妨 作 个 雌 . 
根据 外 部 项 式 格式 文档 中 的 描述 ， 在 二 进 制 串 的 编码 格式 中 ， 类 型 (109 ) 占 1 字 节 ， 数据 长 度 占 
4 字 节 (已 经 解码 完毕 并 存 人 变量 size )， 实 际 的 二 进 制 数据 就 位 于 buf[indqex+5] 处 。 因 此 , 将 
这 个 地 址 连同 数据 长 度 一 起 直接 交 给 parse_json 即 可 。 

在 开始 解析 之 前 ， 还 得 考虑 一 下 应 该 回 Erlang 返 回 什 么 样 的 数据 。 为 了 方便 Erlang 识 别 解析 
过 程 的 成 败 ， 我 们 决定 采用 惯用 的 {ok，Result}/{error，Message} 格 式 。 这 样 一 来 ， 在 对 
解析 结果 数据 进行 编码 之 前 ， 必 须 先 对 元 组 {ok，. . .} 进 行 编码 合 。 

编码 过 程 与 解码 过 程 相 反 : 现 有 的 动态 ei x_buff 输 出 缓冲 区 会 自动 记录 绥 冲 区 的 当前 大 小 和 
偏 移 ， 后 续 数据 会 从 当前 偏 移 位 置 写 入 。 构 造 元 组 时 应 首先 调用 ei_x_encode_tuple_header 
问 缓 冲 区 插入 一 个 元 组 涉 部 ， 表 示 后 面 跟 痢 一 个 特定 大 小 的 元 组 。( 元 组 的 元 素 本 吴 也 可 以 是 元 
组 ， 从 而 形成 藤 套 结构 。) 本 例 中 我 们 要 写 入 的 是 一 个 二 元 组 ， 其 中 第 一 个 元 素 是 原子 ok， 是 通 
过 调用 ei_x_encode_atom 择 入 ， 第 二 个 元 素 将 由 你 定义 的 YAL 回 调 在 解析 过 程 中 构造 而 成 。 

工具 函数 make_error 用 于 报错 。 现 在 ei x_buff 输 出 缓冲 区 已 经 初始 化 完毕 ， 而 且 有 可 能 
经 插入 了 部 分 数据 ， 因 此 不 能 直接 在 make_error 中 使 用 ， 必 须 先 将 它 释 放 再 另行 初始 化 新 的 组 
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冲 区 。 接 者 便 可 以 开始 构造 ferror，Message} 元 组 ;具体 方法 与 构造 {ok, . . .} 元 组 时 大 同 
小 异 ， 只 是 在 构造 包含 错误 信息 的 Message 项 式 时 应 该 调用 ei_x_encode_string。 

最 后 ，write_packet 拯 数 人 负责 将 输出 缕 冲 区 中 编码 完毕 的 项 式 (可 能 是 {ok，Data}, 也 
可 能 是 ferror，Message} ) 写 入 标准 输出 流 ， 并 释放 输出 缓冲 区 。 

5. 主 函 数 

开始 研究 YA 开 回 调 函 数 之 前 ， 还 有 一 个 细节 有 待考 察 ， 那 承 是 程序 的 主 循环 ， 如 代码 清单 
12-5 所 示 : 
代码 清单 12-5 ”c src/jp prog.c: 主 循环 

ni argc, char **argy) 


{ 
static unsigneqd char buf [BUFSIZE]; 








for {;;) 1 
read packet (buf, sizeof (buf}-1, stdin): 
buf [sizeof (buf}-1] = 0; /* Zero-terminate the read data */ 


process_ data (buf).; 
} 
} 


main 孙 数 是 所 有 C 程 序 的 入 口 点 。 它 的 两 个 参数 分 别 是 命令 行 参数 的 个 数 (argc ) 和 实际 传 
入 的 命令 行 参数 字符 串 ( argv )， 不 过 这 个 程序 还 用 不 到 命令 行 参数 。 由 于 实质 工作 都 被 转 入 了 
其 他 函数 ，main 函 数 本 号 十 分 简洁 ， 首先 为 输入 的 数据 创建 缓冲 区 ， 然 后 进入 无 穷 循 环 〈 直至 
代码 清单 12-2 中 的 某 个 函数 调用 exit 为 止 )， 每 循环 一 次 恋 取 并 处 理 一 个 发 目 Erlang 的 数据 包 。 

6. 将 JSON 数 据 解析 成 Erlang 项 式 

现在 开始 讲解 这 个 C 程 序 的 最 后 一 部 分 代码 : 即 YA 开 解 析 器 回调 困 数 。YA 开 在 解析 JSON 数 
据 时 会 伺机 调用 这 些 回 调 。nul11、true/false、 数 值 、 字 符 串 等 简单 类 型 各 有 一 个 回调 。 复 合 
JSON 数 据 结构 (数组 和 映射 ) 则 在 头 尾 两 处 分 别 对 应 于 一 个 回调 。 

我 们 曾经 说 过 ， 每 个 回调 的 参数 列表 中 都 包含 一 个 指 问 state_t 结 构 体 的 指针 ( 即 YAIL 的 
context， 参 见 代 码 清单 12-3 )。 构建 对 应 的 Erlang 项 式 时 ,一切 相关 信息 都 记录 在 该 结构 体内 。 
在 C 中 ， 面 对 这 类 任务 时 我 们 往往 会 经 不 住 使 用 全 局 变量 的 诱惑 ;但 真 要 是 这 人 么 做 了 的 话 ， 等 到 
12.3 廊 换 用 链 入 式 驱 动 时 免不了 还 是 要 推翻 重 写 ， 因 为 链 入 式 驱 动 要 求 代码 必须 可 重 入 。 

在 编写 回调 函数 之 前 , 必须 先 明确 应 该 用 什么 样 的 Erlang 项 式 来 表示 各 种 JSON 数 据 。 二 者 之 
间 的 对 应 关系 参见 表 12-1。 


表 12-1 用 Erlang 项 式 表 示 JSON 数 据 。 其 中 nu11 被 转换 成 了 更 符合 Erlang 规 范 的 原子 'undefined' 


























JSON Erlang 中 的 json () 类 型 

null 'undefined ' 
true 'true' 
false 'false' 
42, 3.14, ... (integers and floats) number () 

' (string) binary () 

[Xx1, x2, ...] (array) { json(), json(), ... } 

{"abc": xl, "def": x2, ...} (map) [ {binary(), json()}, ... |] 
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我 们 选用 的 表示 法 首先 应 该 尽量 如 人 循 Erlang 规 沁 ( 比如 用 原子 'undefined' 来 表示 nul1 )， 
其 次 要 省 空间 ( 比如 用 二 进 制 串 来 表示 JSON 字 符 串 和 映射 中 的 标签 )， 最 后 还 不 能 有 上 疏 义 。 看 到 
列表 ， 就 知道 它 表 示 的 肯定 是 键 / 值 对 映射 ， 不 会 是 字符 串 或 数组 。 看 到 不 是 键 / 值 对 的 元 组 ， 了 就 
知道 它 表示 的 肯定 是 数组 。 用 Erlang 元 组 来 表示 JSON 数 组 更 便于 用 下 标 访问 数组 , 而 且 也 比 列表 
更 省 空间 ; 但 另 一 方面 ,增删 数组 元 素 时 不 得 不 先 临 时 将 元 组 转换 成 列表 。 权 衔 之 后 我 们 认为 这 
个 代价 是 值得 的 。 

现在 我 们 已 经 知道 输出 结果 应 该 长 成 什么 样子 了 了 ， 下 面 先 来 看 几 个 简单 的 YA 开 回 调 ， 如 代 
码 清单 12-6 所 示 。 


代码 清单 12-6 cc src/jp prog.c: 简单 YA 开 回 调 


static void count element {state t *st) 


























{ 
Container tt +*c = St->c; 
It tc != NULL) ++(c->count): 
} 6 递增 当前 容器 中 的 元 素数 目 
static int handle null {void *ctx) 
{ 
state 七 *st = (State 七 *}ctx; 


COuUunNnt element (st).: 
e1 x encode atom(&st->x, "undefined'")}); 
return 1; 


} 
static int handle boolean{void *ctx, int boolVal) 
{ 

state tt *st = {state t *})ctx; 


Count element (st): 
eli _ x encode boolean(&st->x, boolVal}); 
return 1; 


} 


static int handle integer(void *ctx, long integerVal) 
{ 

state 七 *st = (state t *})ctx:; 

Count element (st ) :; 

ei_x encode_long(&st->x, integerVal); 

EN 


static int handle double{void *ctx, double doubleVal) 
{ 

state 七 *st = (state 七 *)ctx; 

count element (st): 

ei x encode doublel&kst->x, doubleVval)}: 

return 1; 


L 


static int handle string(void *ctx, const unsigned char *stringVal, 
unsigned int stringLen) 





1 
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state t *st = state 七 *)ctx; 
count _ element (st}; 将 JSON 字 符 串 编码 为 
ei x encode binary (&st->x, stringVal, stringLen); 二 进 制 串 


return 1; 


} 


static int handle map key {void *ctx, const unsigned char *stringVal, 





unsigned int stringLen) 


{ 
tate t et = [state t iety: 开始 编码 用 于 表示 键 / 
Bi XK encode 二 DT EGR 值 对 的 二 元 组 
el x encode binary (&st->x, stringVal, stringLen)}); 
return 1; 


} 

上 面 所 有 函数 都 用 到 了 辅助 函数 count_element ， 该 函数 用 于 递增 当前 容器 结构 体 ( 如 果 
存在 的 话 ) 中 的 元 素 计 数 (参见 代码 清单 12-1 ) 人 @。 例 如， 如 果 在 某 数 组 中 发 现 一 个 整数 ， 那 么 
该 数组 的 元 取 计数 便 会 加 一 。 了 解 这 一 点 后 ， 这些 函数 的 作用 就 显而易见 了 ,无 非 就 是 问 输 出 绥 
冲 区 中 搬入 各 种 数据 畦 了 。 以 handle_string 为 例 ， 该 回调 的 作用 就 是 调用 ei_x_encode_ 
binary 将 JSON 字 符 串 转 换 成 缓冲 区 中 的 二 进 制 串 信 。 这 些 回 调 的 返回 值 都 是 1， 表 示 “ 一 切 正 
常 ， 请 继续 解析 ”。 其 中 有 一 个 函数 特别 值得 注意 ， 它 就 是 handle_map_key。 该 图 数 用 于 解析 
JSON 了 映射 键 / 值 对 中 的 键 。 

在 解析 过 程 中 倍 到 键 / 值 对 时 ， 解 析 融 一 定 处 在 映射 的 解析 过 程 当 中 ， 因 此 必然 已 经 准备 好 
了 用 于 存放 键 / 信 对 的 列表 。 每 个 键 / 值 对 都 是 个 由 键 和 值 构成 的 二 元 组 ; 和 代码 清单 12-4 中 的 
{ok，. . .} 元 组 的 编码 方法 一 样 ， 只 需 搬 入 一 个 二 元 组 的 头 部 个， 再 在 第 一 个 元 素 的 位 置 上 搬入 
(二 进 制 串 格式 的 ) 键 即 可 。 下 一 个 回调 函数 会 在 第 二 个 元 素 的 位 置 上 插入 与 键 相对 应 的 值 ， 从 
而 将 二 元 组 补 全 。 很 简单 吧 ? 〈 请 注意 ,只 有 在 处 理 键 / 值 对 中 的 信 时 才能 调用 count_element， 
处 理 键 时 不 能 调用 ， 因 为 只 有 在 整个 元 组 处 理 完毕 之 后 才能 递增 映射 的 元 素 计 数 。) 





























YAJL 怎样 处 理 键 / 值 对 

在 各 个 YAJL 回调 函数 中 ， 只 有 键 / 值 对 中 的 键 所 对 应 的 回调 函数 比较 特殊 。 值 的 部 分 无 
须 特 殊 处 理 一 一 直接 调用 首 通 的 回调 函数 即 可 。 如 有 必要 ,可 以 在 状态 结构 体 中 添加 一 个 标志 
位 ， 用 于 标识 下 一 个 值 是 否 录 属于 某 个 键 / 值 对 ， 我 们 将 在 12.3 节 中 运用 这 一 手法 ， 不 过 目前 
还 没有 做 此 特殊 处 理 的 必要 。 





最 后 就 轮 到 数组 和 映射 了 。 这 两 种 数据 结构 在 头 尾 两 处 必须 区 别 对 每 ， 因 而 一 共用 到 了 4 个 
回调 函数 。 这 部 分 代码 有 点 儿 复 杂 ， 参 见 代 码 清单 12-7。 


代码 清单 12-7 c src/jp prog.c: 映射 和 数组 的 YA 于 回调 
static int handle start (void *ctx, int array) 
{ 
state t *st = (state t *}ctx; 
COUNt element (St ) : 
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container t xc = malloc!(sizeof (container t)}); 
Cc->next = st->c; 分 配 新 容器 并 进行 链接 
st->c = Cr; 和 初始 化 
C->COoOunt = 0; 
C->index = st->x,index; 
1f (array) { 
el x encode tuple header (&st->x, 1).， 插入 元 组 或 列表 临时 头 部 
} else { 
eli x encode list header (&st->x, 1}).; 
} 
return 工 ; 
} 
static jint handle start map (void *ctx) 
{ 
return handle start (ctx, 0}).: 
} 


static int handle start array (void *ctx) 
{ 


return handle start (ctx, 1}).: 


} 
static jint handle end{(voiqd *ctx, int array) 
{ 

state t *st = (state t *)ctx; 

Container tt xcC = st->c; 


if (array) { 
ei_encode tuple heagder{(st->x.buff, &c->index, CcC->count).; 
} else { 
ei encode list header (st->x.buff, &c->index, c->count)}.; 
ei_ x encode empty_listl(&st->x); 
} 
St->c = C->next,; » 摘除 并 释放 容器 
free(c); 
return 工 ; 


} 


static int handle end mapl{lvoid *ctx) 
{ 
return handle endtictx, 0}).;: 


} 


static jint handle _ end array (voiqd *ctx) 
{ 
return handle end(ctx, 1}.;: 


| 


将 最 终 的 元 素数 十 


上 
~ F3 


> 
4 
如 


结构 体 


本 例 中 上 映射 和 数组 的 处 理 方 式 极为 相似 。 人 简便 起 见 ， 我 们 将 相似 的 代码 合并 成 了 
handle start 和 handle_end 两 个 公共 隐 数 ， 并 用 一 个 标志 变量 来 表示 当前 处 理 的 是 数组 还 是 





映射 。 





handle_start 首 先 递 增 当 前 容 融 的 元 系 计 数 一 一 显然 ， 位 于 数组 中 的 数组 应 该 算 作 其 父 容 











人 骼 的 元 系 ， 而 不 能 算 作 它 目 吴 的 元 条 。 接 下 来 ， 用 malloc 分 配 一 个 用 于 指 代 当前 容 豆 的 新 的 容 从 
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结构 体 ， 然 后 把 它 存 和 人 解析 融 状 态 并 清 雪 元 素 计 数 。 另 外 请 注意 ,务必 要 记 下 ei x_buff 的 当前 下 
标 ， 待 会 儿 我 们 还 要 回 到 这 里 做 一 些 收尾 工作 人 @。 一 切 就 绪 之 后 , 根据 正在 构建 的 是 数组 还 是 映 
射 ， 再 相应 搬入 一 个 元 组 头 部 或 列表 头 部 仿 。 由 于 暂时 还 不 知道 容器 中 确切 的 元 素数 目 ， 头 部 中 
的 元 又 计 数 暂 设 为 1。 

当 handqle_endq 被 调用 时 ， 容 带 中 的 确切 元 素数 目 已 经 揭晓 。 这 时 束 可 以 更 新 先前 写 人 容 亲 
头 部 的 元 素数 目 了 。 这 个 更 新 操作 可 通过 调用 si_encodqe_tuple_heaaqet 来 完成 《对 于 列表 应 
调用 ei_encode_list_header ) 合 ,调用 参数 分 别 是 指 癌 当 用 ei_x_buff 绥 冲 区 起 始 位 置 的 指针 <、 
先前 保存 在 容 怖 结构 体 中 的 绥 神 区 下 标 以 及 容 需 中 的 元 素数 目 。ei_encode_ 系 列 困 数 与 
ei_x_encode_ 系 列 函 数 的 区 别 在 于 前 者 将 内 存 管 理 全 权 交 由 开发 者 负 贡 ， 因 此 它们 不 会 修改 
ei_x_buff 结 构 体 中 的 当前 下 标 一 一 它 只 会 履 盖 先前 插入 绥 冲 区 的 临时 容 瘟 头 部 。 如 果 处 理 的 是 
列表 ， 还 需要 调用 ei_x_encode_empty_1list 插 入 一 个 空 表 一 一 注意 这 个 空 表 位 于 列表 中 最 后 
一 个 元 系 的 后 面 ， 而 不 是 在 表 头 的 后 面 ( 因为 调用 的 是 ei x_encode_... 靖 数 一 一 译 者 注 )。 至 此 ， 
输出 绥 冲 区 的 状态 如 图 12-4 所 示 。 

最 后 ， 将 容器 结构 体 从 解析 器 状态 中 摘除 并 释放 内 存 售 。 



























































先前 保存 的 当前 下 
下 标 位 轩 标 位 置 





evelslw 
MA 
列表 的 类 型 ”更 新 后 的 确 
编写 切 元 素数 目 


图 12-4 在 列表 头 部 补 上 最 终 的 长 度 。 先 前 保存 的 下 标 指 回 列 表 头 部 的 起 始 处 ， 而 动 
态 的 ei_x_buff 的 当前 下 标 则 指 回 列 表 尾 部 之 后 的 第 一 个 字 节 


呼 ! 可 真是 人 够 蔷 吉 的 。 不 过 这 个 示例 还 没 结束 ， 还 有 两 种 集成 方法 有 竺 介绍。 在 下 一 世 中 ， 
我 们 将 引入 链 入 式 驱 动 , 好 在 所 需 修 改 的 代码 并 不 多 。 先前 为 优化 代码 结构 而 付出 的 努力 总 算是 
有 了 回报 。 人 至 于 现在 ,不 妨 完 把 代码 跑 起 来 看 看 吧 。 














12.2.3 ”编译 运行 


请 将 src 下 的 .erl 文 件 逐 一 编译 为 epin 目 录 下 的 .beam 文 件 。c_src/jp_prog.c 则 应 编译 为 priv 目 录 
下 的 jp_prog 可 执行 文件 ， 以 供 Erlang 代 码 通 过 端口 调用 。 此 外 ， 还 需要 编写 一 个 名 为 json_parser 
的 前 端 API 模 块 ， 该 模块 应 导出 以 下 本 数 : 


parse document (Data) 一 > 











jpP_server:parse document (Data). 
请 用 以 下 命令 行 调用 gcc 编 译 需 编译 C 代 三 : 
S gcc =-o ./priv/jJpP_pProg -IS{OTPROOT}/1ib/erl interface-3.6.5/include 


-IS{YAJLROOT}/include -LS{OTPROOT}/1ib/erl interface-3.6.5/1ib 
-LS{YAJLROOT}/1ib ./c_ src/jJpP _ prog.c -lei st -lyajl 
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在 执行 上 述 命令 之 前 , 必须 先 定义 两 个 环境 变量 , 分 别 是 指向 Erlang 安 装 路 径 的 orPROOT( 一 
般 是 /usr/lib/erlang， 如 果 弄 不 清楚 具体 路 径 , 请 在 Erlang 中 调用 code:root_qdir() ) 和 指向 YAJL 
安 狐 路 径 的 YAJLROOT。( 如 有 果 下 和 载 YA 儿 之 后 只 编译 不 安 冯 ， 则 该 路 径 应 类 似 于 
lloyd-yajl-1.0.9-0/build/yajl-1.0.9/。 ) 请 注意 命令 行内 必须 用 -I 选项 指定 Erl_Interface 和 YAJL 的 头 文 
件 路 径 ， 用 -选项 指定 链接 过 程 中 库 文 件 的 查找 路 径 ， 以 及 用 -1 选项 指定 要 链接 的 库 的 名 称 。 
另外 还 需要 注意 命令 行 中 源码 文件 和 库 文件 出 现 的 次 序 。 

现在 priv 目 录 下 的 jp_prog 可 执行 文件 应 该 已 经 准备 就 绕 。 由 于 所 有 输入 都 党 有 四 字 市 长 的 前 
级 ， 和 耻 接 在 命令 行 下 进行 测试 比较 困难 一 一 在 Erlang 中 测试 反倒 更 容易 些 。 不 过 在 启动 jp_prog 之 
前 ， 必 须 先 告知 系统 YA 开 库 的 位 置 。 如 果 YA 开 安装 在 非 标准 位 置 下 ， 请 按 下 列 方式 修改 


LD LIBRARY PATH 环 培 变量 : 


























$ export LD LIBRARY PATH=S$ {YAJLROOT}/1ib 


如 果 你 用 的 是 Mac OSX， 则 应 修改 DYLD_LIBRARY_PATH: 

















$ export DYLD LIBRARY PATH=S {YAJLROOT}/1ik 
然后 ， 在 Erlang 中 启动 json parser 应 用 ， 并 尝试 解析 硅 干 JSON 文 档 。( 记得 在 -pa 选项 中 加 上 
json parser 目 录 ， 和 否则 code:priv_div1 无 法 找到 应 用 目录 ， 参 见 12.2.1 节 。) 


S erl -pa ../json parser/ebin 

















1> application:start (json parser). 
ok 
2> Doc = <<'" [null, true, {\"int\": 42, \"fjoat\": 3.14}] ">>. 


3> json parser:parse _ document (Doc ) . 
{ok, {undefined,true, [{<<"int">>,42}, {<<"float"™>>,3.14}]}} 
4> 


成 功 了 1 可 以 看 到 nul1 被 转换 成 了 unaqefinedq， 了 映射 中 的 键 从 字符 串 变 成 了 二 进 制 串 ， 节 
外 层 的 JSON 数 组 被 转 成 了 元 组 ， 而 映射 也 被 表示 成 了 键 / 值 二 元 组 的 列表 。 

C 库 的 集成 工作 终于 完成 了 ， 一 切 都 严 丝 合 毋 。 然 而 在 生产 环境 下 ， 当 服务 天 人 负载 较 局 时 ， 
序列 化 / 反 序 列 化 以 及 管道 通信 的 开销 会 变 得 难以 八 受 。 好 在 我 们 已 经 有 了 应 对 之 策 一 一 将 程序 
改造 成 链 入 式 驱 动 。 


12.3 ”开发 链 入 式 驱 动 


整合 外 围 代码 时 , 一 般 不 会 一 上 来 就 用 链 入 式 驱 动 。 不 过 现在 呢 , 负责 对 接 外 于 程序 的 端口 
已 经 稳定 可 用 ， 只 是 性 能 方面 有 些 拖 后 腿 。 在 这 种 情况 下 ， 就 可 以 考虑 换 用 链 入 式 驱 动 了 。 

之 前 用 C 编 写 的 解析 需 运 转正 党 ， 没 有 必要 再 做 修改 。 只 需 对 解析 需 的 逻辑 加 以 包装 ， 让 
Erlang 能 够 加 载 并 启动 解析 器 ， 进 而 与 之 建立 通信 就 可 以 了 。 说 白 了 就 是 把 main 函 数 换 成 符合 
erl_driver API 要 求 的 回调 孔 数 ， 再 补充 奇 干 链 入 式 驱 动 专用 的 辅助 数据 结构 及 函数 。 不 过 现在 ， 
我 们 得 先 看 看 链 入 式 驱 动 的 代码 与 外 围 程序 的 代码 都 有 哪些 不 同 。 
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12.3.1 初 识 链 入 式 驱 动 


我 们 曾经 在 12.1.2 市 中 说 过 ， 虽然 表 面 上 看 链 入 式 驱 动 和 普通 端口 差不多 ,但 它们 的 压 层 机 
制 却 大 相 径 星 。 普通 外 围 端口 程序 通过 标准 IO 与 Erlang 通 信 , 链 入 式 驱 动 则 通过 用 户 目 定义 的 回 
调 孔 数 来 接收 数据 。 回 调 函 数 要 先 处 理 数据 ， 然 后 将 处 理 结 来 返回 Erlang。 和 普通 剖 口 背后 的 外 
转 程 序 一 样 , 同一 段 链 入 式 驱 动 代码 也 有 可 能 被 生存 期 相互 午 合 的 多 个 独立 端口 并 发 调用 。 由 于 
在 运行 时 所 有 这 些 端 口 共 至 Erlang VM 的 内 存 ， 而 且 不 同 端 口 还 有 可 能 分 属 不 同 的 线程 ， 因 此 了 驱 
动 代码 必须 可 重 入 ( 可 同时 被 多 个 调用 方 调用 )， 不 得 依赖 任何 全 局 变量 或 锁 。 

C 程 序 或 库 中 的 长 效 数 据 分 为 两 类。 第 一 类 是 全 局 变量 ， 也 就 是 C 语 言 中 的 外 部 变量 。 这 些 
变量 定义 在 所 有 孙 数 之 外 ， 只 要 程序 还 在 运行 、 库 还 被 加 载 者 ， 它 们 便 一 直 有 效 。 然 而 问题 在 于 
全 局 变量 只 有 一 份 , 如果 多 方 并 发 调用 同一 段 代 码 ,， 调用 方 之 间 便 会 相互 覆盖 对 方 的 数据 ， 从 而 
导致 数据 损坏 力 至 程序 骨 演 。 

举 个 例子 , 假设 你 写 了 一 个 提供 计数 办 加 功能 和 当前 计数 查询 功能 的 简单 端口 驱动 。 在 不 考 
虑 可 重 入 性 的 情况 下 ， 完 全 可 以 用 C 的 全 局 变量 来 实现 计数 各 。 如 来 一 次 只 为 一 个 调用 方 服务 ， 
完全 没有 问题 。 现 在 假设 用 户 需 要 5 个 计数 一 ， 并 为 此 局 动 了 5 个 运行 看 同一 登 驱 动 代码 的 端口 。 
不 秆 的 是 ， 由 于 5 个 冰 口 累加 的 是 同一 个 全 局 变量 ， 彼 此 之 间 的 干扰 将 导致 最 终结 东 一 团 乱 厅 。 
在 这 种 情况 下 ， 了 驱动 内 部 状态 被 多 个 驱动 实例 所 共 至 ， 如 图 12-5 所 示 。 


= \ 
I 蝶 动 实例 


图 12-5 不 可 重 和 的、 使 用 全 局 共享 内 存 的 链 入 式 驱 动 代码 。 所 有 驱动 实例 采用 同一 
块 内 存 区域 存 储 自身 的 数据 ， 这 样 做 很 容易 导致 衣 江 
为 一 类 长 效 数据 就 是 动态 分 配 的 内 存 数 据 。 如 末 库 的 调用 者 目 行 分 配 所 需 的 内 存 , 不 再 干扰 
其 他 调用 者 的 内 存 数据 ,并 发 调用 束 不 足 为 届 了 。 这 正 是 链 入 式 驱 动 所 要 达到 的 效果 。 我们 将 这 
块 内 存 及 其 内 容 称 作 实 例 专 有 数据 。 仍然 沿用 上 面 的 计数 右 驱 动 示 例 ， 如 末 每 个 驱动 实例 都 在 目 
已 独占 的 数据 区 域内 维护 计数 带 变 量 , 便 万 事 大 吉 了 : 每 打开 一 个 端口 ， 虱 会 分 配 一 个 单独 维护 
的 计数 剖 ， 各 计数 从 之 间 互 不 干扰 。 如 图 12-6 所 示 。 


二 一 
| 实例 专 有 
人 一 | 数据 区 
磷 动 实例 


图 12-6” 仅 使 用 实例 专 有 数据 的 、 可 重 入 的 链 入 式 驱 动 。 每 个 实例 都 有 目 己 的 工作 内 
人 存 ， 互 不 干扰 






















































全 局 数据 区 
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这 部 分 内 存 可 以 在 驱动 初始 化 时 分 配 ， 也 可 以 按 需 动态 分 配 。Erlang erl driver API 中 的 
driver_ alloc() 和 driver_ free() 等 辅助 浮 数 就 是 专 为 链 入 式 驱 动 代 公 的 内 存 管 理 而 设 
计 的 O 

讨论 完 这 些 ， 就 该 者 手 实现 7 了。 为 外 围 程序 编写 的 代码 大 部 分 痢 可 以 在 链 入 式 驱 动 中 复 用 。 
唯一 需要 修改 的 就 是 Erlang 与 C 代 码 的 对 接 方 式 。 








12.3.2 ”驱动 的 C 语 言 部 分 


此 前 的 C 代 码 是 个 市 有 main 函 数 的 独立 程序 ， 该 程序 通过 与 端口 对 接 的 标准 输入 /输出 与 
Erlang VM 通 信 。 在 链 入 式 驱 动 中 , 由 于 C 代 人 码 与 Erlang 运 行 时 系统 运行 在 同一 地 址 空间 内 , Erlang 
VM 可 以 耳 接 调用 驱动 代码 中 的 回调 函数 ， 二 者 之 间 的 通信 便 由 这 组 回调 也 数 完成 。 相 关 人 逻辑 将 
会 用 到 erl driver API， 详 情 请 参见 Erlang/OTP 文 档 中 的 ERTS 参 考 手册 。 

这 一 市 将 详细 讨论 Erlang VM 如 何 与 C 代 码 对 接 。 我 们 将 以 上 一 市 中 的 c_src/jp_prog.c 为 蓝本 
进行 修改 ， 请 将 该 文件 复制 一 份 ， 命 名 为 ec_ src/jp_driver.c。 首 先是 所 有 链 入 式 驱 动 代码 都 应 包含 
的 erl driverh 头 文件 : 

#include <erl driver.h> 

另外 ， 由 于 链 入 式 驱 动 不 使 用 标准 LO 和 退出 状态 码 ，BUFSIZE、ERR 等 安定 义 就 没有 存在 
的 必要 了 了 。 与 此 同时 , Write packet、 read bytes.、 read packet 以 及 main 陋 数 也 全 都 可 
以 删除 。 

接 下 来 ， 还 要 添加 一 些 和 erl_driver API 相 关 的 定义 。 如 代码 清单 12-8 所 示 。 


代码 清单 12-8 c src/jp driver.c: erl_gdriver 相 关 定 义 


static ErlDrvData drv_ start (ErlDrvPort port, char *command); 



































static void drv stop (ErlDrvData handle); 
static void drv output {ErliDrvData handle, char *buf, int sz}; 














static ErlDrvEntry Jp_driver_ entry = 1 
NULL, je 动 结构 休 
drv_ start, /yx start */ 
drv_stop, /* gtop */ 
drv_output, A* output */ 
NULL, /* ready_input */ 
NULL, /* ready_output */ 
"jpP_driver", /* driver name *)/ 
NULL, /xx finish xy/ 
NULL, A/* handle {reserved) */ 
NULL, A:* control */ 
NULL, /A* timeout */ 
NULL, jf* outputvy */ 
NULL, /A* ready_asynce */ 
NULL, A:* flush */ 
NULL, i* Gall *y 
NULL, /* event */ 








ERL_DRYV_EXTENDED MARKER, /* ERL_ DRYV_EXTENDED MARKER */ 
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ERL_ DRYV_ EXTENDED MAJOR VERSION, /* ERL DRYV_ EXTENDED MAJOR VERSION */ 


ERL_DRV_EXTENDED MAJOR_VERSION, /* ERL_DRV_EXTENDED MINOR_VERSION */ 
ERLDL_DRYV_FLAG_USE_PORT_ LOCKING /* ERL_ DRV_FLAGS */ 























3 
DRIVER INIT{(jpP driver) 


6 将 驱动 告知 Erlang 


return &jp driver entry; 


) 


typedef struct { 


BLOEVDOrGe DO 8 实例 专用 数据 的 结构 体 


} Grv data 七 ; 

首先 声明 后 续 将 要 实现 的 各 个 回调 函数 。 然 后 ， 将 这 些 回调 告知 给 Erlang VM。 创建 一 个 
ErlDrvEntry 绪 构 体 ， 在 我 们 打算 实现 的 回调 也 数 的 位 置 上 填 入 相应 的 函数 指针 ， 对 于 其 他 回 
调 则 填 和 人 NULL@@。 这 个 结构 体 是 整个 驱动 代码 的 关键 所 在 。 其 中 大 部 分 字段 都 是 各 式 各 样 的 回 
调子 数 指针 ， 通 过 实现 这 些 回 调 隐 数 便 可 完成 所 需 的 各 种 功能 。 在 本 例 中 ， 我 们 只 关注 start、 
stop 和 output3 个 回调 。 此 外 ， 还 有 一 个 必须 填写 的 关键 字段 : driver_name。 在 打开 端口 的 
时 候 ，Erlang 将 根据 这 个 字段 来 定位 相应 的 Erl1DrvEntry 结 构 体 。 详 情 请 参见 12.3.4 节 。 

DRIVER_INIT 宏 用 于 问 Erlang YM 注册 ErlDrvEntry 结 构 体 。 宏 中 的 驱动 名 称 必须 与 结构 体 
中 的 保持 一 臻 ， 但 要 去 掉 引 号 。 紧 跟 宏 之 后 的 大 括号 内 会 返回 一 个 指向 待 注册 结构 体 的 指针 人 @。 

最 后 ,定义 用 来 存放 实例 专 有 驱动 数据 的 结构 体 ， 参见 图 12-6。 驱 动 中 的 各 种 需要 跟 回 调调 
用 的 、 需 要 长 期 保存 的 信息 都 记录 在 该 结构 体内 ， 其 作用 与 gen_server 的 状态 记录 类 似 合 。 本 例 
中 只 和 需 记 录 Erlang 病 口 ， 以 便 告 知 驱 动 代码 在 完成 解析 后 问 何 处 输出 结果 。 我 们 一 般 选 择 在 驱动 
的 start 回 调 中 为 结构 体 分 配 内 存 ， 该 回调 将 返回 一 个 被 转换 为 特殊 指针 类 型 Erl1DrvData 的 指 
问 该 结构 体 的 指针 。Erlang VM 将 以 调用 参数 的 形式 将 这 个 Erl1Drvpata 指 针 传 递 给 其 他 驱动 回 
调 也 数 ， 以 供 后 续 随 时 访问 。 

1. 端口 驱动 回调 

部 分 驱动 回调 函数 与 驱动 的 生存 期 有 关 , 如 分 别 在 端口 开 财 时 调用 的 start 和 stop。 其 余 回 
调 则 在 Erlang 方 面 有 数据 就 绪 时 生效 。 开 发 驱动 时 ， 可 供 选 择 的 回调 有 十 几 个 之 多 ， 不 过 好 在 并 
不 是 每 个 都 要 实现 一 遍 。 对 于 大 部 分 驱动 而 言 ， 必 不 可 少 的 只 有 start 和 stop 男 数 ， 多 半 还 会 带 
上 init。 至 于 通信 相关 的 回调 函数 ， 完 全 就 是 因地制宜 各 取 所 需 了 。 

本 例 中 需要 实现 的 通信 回调 函数 只 有 output。 请 注意 ， 除 start 子 数 以 外 ， 所 有 回调 函数 
的 第 一 个 参数 都 是 由 start 返 回 的 Br1DrvData 人 句柄 。 

表 12-2 列 出 了 可 供 选 用 的 所 有 回调 。 如 你 所 见 ， 选 择 余 地 非常 之 大 ,不 过 在 单一 驱动 中 不 太 
可 能 会 用 上 所 有 回调 。 


表 12-2 ”可 供 选 用 的 ezL_arivezr 回 调 函 数 。 驱 动 按 需 实 现 ， 剩 下 的 置 为 NULL 即 可 

































































回调 描述 

和 和 对 于 静态 链接 的 驱动 ， 在 系统 启动 时 调用 ， 对 于 动态 加 载 的 驱动 ， 在 加 载 完 成 时 
调用 

a 在 执行 open_port/1 时 调用 
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回 调 
stop 
output 


ready_input 
ready_output 
finish 
control 
timeout 


outputyv 


ready_async 


flush 


用 端口 和 NIF 集成 外 转 代 三 


措 述 
在 关闭 端口 时 调用 
0 口 输出 数据 时 调用 。 如 果 启 用 了 outputv 回 调 ， 则 该 回调 
当 驱 动 句 柄 上 的 输入 数据 就 绪 时 调用 。 用 于 异步 IO 
当 预 备 好 回 某 端口 句柄 输出 数据 时 调用 。 用 于 异步 IO 
在 驱动 被 卸载 前 调用 。 仅 用 于 动态 加 载 的 驱动 
类 似 于 用 于 驱动 的 ijoctl。 在 Erlang 方 面 调 用 port_control/3 时 调用 
在 调用 驱动 定时 絮 时 调用 
当 有 人 在 Erlang 中 向 端口 写 入 数据 时 调用 。 如 果 未 定义 该 回调 ， 则 改 用 output 回 
调 来 处 理 数据 写 入 
人 在 driver_async 异 步调 用 完成 时 调用 
关闭 端口 前 必须 先 刷 新 驱动 队列 中 的 数据 才能 调用 stop，flush 便 在 此 时 调用 





call 类 似 于 control 回 调 ， 但 输入 输出 采用 的 是 Erlang 的 外 部 项 式 格式 
event 在 driver_event () 指定 的 事件 发 生 时 调用 


2. 内 存 管 理 

时 过 境 迁 ， 现 在 ， 了 驱动 代码 运行 在 Erlang VM 的 地 址 空间 内 : 可 不 能 再 用 C 的 标准 库 函 数 
malloc 和 free 来 管理 内 存 了 。 开 发 链 人 式 驱 动 时 ， 应 该 换 用 erl driver 库 中 的 driver_alloc () 
和 driver_free() 限 数 。 所 对 YA 并 库 比较 灵活 ， 人 允许 你 自行 制定 内 存 分 配 也 数 。 只 需 简 单 包 法 
一 下 driver_ alloc()、driver realloc() 和 driver_free()， 再 将 包装 隐 数 的 指针 填 入 结 
构 体 ， 让 它们 能 为 YAJL 所 用 就 可 以 了 。 详 情 参 见 代 码 清 单 12-9。 


代码 清单 12-9 c src/jp_driver.c: YA 开 内 存 管理 回调 


static void *alloc func(void *ctx, unsigned int sz) 
{ 
return driver alloc!(sz).， 


} 








static void *realloc func{void *ctx, void *ptr, unsigned int sz) 
{ 
return driver_ realloc(ptr, sz); 


} 


static void free func{void *ctx, void *ptr) 
{ 
driver_free (ptr).;: 


} 


static yajl alloc funcs alloc funcs = { 
alloc_ func, 
realloc func, 
free funec, 
NUDLL 
}; 
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结构 体 中 的 最 后 一 个 元 素 是 YA 所 的 上 下 文 指针 , 这 几 个 国 数 都 以 它 为 第 一 个 参数 。( 不 要 把 
它 跟 传 给 其 他 YAJL 回 调 的 上 下 文 指 针 搞 混 ; 除非 特别 指定 ， 否 则 二 者 不 一 定 相 同 。) 不 过 这 里 不 
需要 什么 上 下 文 ， 将 结构 体 中 的 最 后 一 个 字段 置 为 NULL 妈 可。 最后， 让 YAJL 改 用 新 的 内 存 分 配 
哨 数 就 行 了。 回想 一 下 ，parse_json 网 数 是 这 样 调用 yaj1l1_alloc 的 : 

yh = yajl alloc (gcallbacks, &cfg, NULL, st}; 


设置 为 NULL 的 参数 就 是 用 于 指定 yaj1l1_alloc_funcs 绪 构 体 的 。 现 在 ， 将 该 调用 修改 如 下 : 














yh = yajl alloc(&kcallbacks, &cfg, &alloc funcs, st); 
这 样 就 可 以 让 YA 用 driver_alloc 来 代替 mallocJ。 
代码 中 还 有 两 处 和 内 存 管理 相关 的 位 置 需要 修改 。handle_start 问 调 咀 数 中 的 











container t *c = mallocl(sizeof (container 七 ) ) : 
应 修改 为 
container t xc = driver allocl(sizeof (container t))});: 
另外 ，handl e_endq 盯 数 中 的 
freelc); 
现在 应 该 改 成 


driver EreelcCh) : 


用 ariver_alloc 和 蔡 换 malloc 使 得 我 们 可 以 用 Erlang VM 中 特殊 设计 的 内 存 管理 函数 以 线程 安 
全 且 可 重信 的 方式 来 接管 内 存 管 理 。 

3. 将 数据 发 回 Erlang 

当 端 口 有 数据 需要 输出 给 端口 所 属 的 进程 时 ， 链 入 式 驱 动 应 调用 erl driver 中 的 driver_ 
output API 咕 数 来 加 Erlang 节 点 回 传 数 据 。 该 调用 会 将 指定 缓冲 区 中 的 数据 写 入 由 第 一 个 调用 
参数 指定 的 端口 。 为 了 访问 ( 记录 在 实例 专 有 驱动 数据 结构 体 中 的 ) 端口 ， 应 在 process_aqata 
中 数 的 参数 列表 中 加 入 一 个 指 问 该 数据 结构 体 的 指针 。 因 此 该 函数 原本 的 子 数 原型 

static void process data{(unsigned char *buf) 
应 修改 为 

static void process datal(drv data t *d, unsigned char *hbuf; 

然后 ， 在 函数 体 结尾 ， 原 有 的 调用 

write packet (st.x.buff, st.x.buffsz, stdout); 
应 该 修改 为 

driver output (Gd->port, st.x.buff, st.x.buffsz): 
至 此 ， 将 原 有 代码 改写 为 链 入 式 驱 动 的 工作 几 近 完工 。 和 独 下 的 就 是 驱动 回调 函数 的 实现 了 。 

4. 驱动 回调 实现 

最 后 ， 我 们 来 看 看 驱动 中 3 个 回调 函数 的 实现 : start. stop 和 output， 如 代码 清单 12-10 
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所 不 。 


代码 清单 12-10 c src/jp driverc: erl_driver 回 调 
static ErlDrvData drv start (ErlDrvPort port, char *commanga,) 
{ 
drv data tt *d = (drv data t *}driver alloc(sizeof (drv data t)).; 
d->port = port,; 
return (ErlDrvData}d.; 


} 


static void drv stop(ErlDrvData handle) f{ 
driver_ free{{char *)handle).:; 


} 


static void drv_output (ErliDrvData handle, char *buf, int gz) 
{ 


process datal(l{(gdrv_data t *}handle, (unsigned char *}buf); 


} 

首先 是 在 驱动 实例 启动 时 (也 就 是 用 该 驱动 打开 端口 时 ) 调用 的 drv_start。 该 辆 数 会 创建 
供 其 他 聘 数 使 用 的 实例 专 有 数据 结构 体 并 在 其 中 存 入 Erlang 闪 口 的 标识 符 。 随 后 ， 指 问 该 结构 体 
的 指针 将 被 转换 为 ErlDrvDpata 类 型 并 被 当 作 调用 结果 返回 。 

接 下 来 是 在 端口 天 财 时 调用 的 arv_stop, 它 负 责 调 用 driver_free 释 放 实 例 专 有 数据 结构 
体 。 在 更 为 复杂 的 链 入 式 驱 动 中 ，start 回 调 有 可 能 还 会 启动 线程 、 分 配 初始 化 资源 等 。 负 贡 释 
放 这 些 资 源 、 清 理 这 些 线程 的 ， 通 向 就 是 stop 回 调 。 

qrv_output 国 数 是 本 例 中 用 到 的 唯一 一 个 和 通信 相关 的 回调 。 其 功能 和 12.2 节 中 的 外 于 程 
序 的 main 困 数 相 近 ， 只 是 驱动 程序 与 Erlang VM 之 间 的 通信 方式 变 了 。 有 别 于 之 前 采用 的 独立 操 
作 系 统 进 程 之 间 的 字 世 流 , 链 入 式 驱 动 与 Erlang 之 间 的 通信 是 由 Erlang YM 下 接 调 用 drv_output 
回调 也 数 来 实现 的 ， 序 列 化 和 反 序列 化 操作 也 和 VM 目 号 共同 运行 在 同一 地 址 空间 内 。 处 理 冀 循 
环 也 没有 必要 了 ， 只 要 有 数据 发 送 至 端口 处 ，Erlang VM 随时 都 可 以 调用 驱动 程序 ， 只 需要 将 数 
据 指 针 连 同 指 回 实例 专 有 数据 的 指针 一 并 传递 给 process_aqata 胃 数 便 可 。 

将 新 代码 与 上 一 六 中 的 程序 做 个 比较 ， 除 通信 部 分 以 外 ， 其 余 代码 完全 一 样 。 这 样 一 来 ， 你 
便 可 以 因地制宜 地 作出 选择 : 外 围 程序 安全 有 余 而 效率 不 足 ; 链 入 式 驱 动 速度 更 快 却 有 可 能 导致 
整个 VM 朋 省 。 无 论 采 用 的 是 哪 种 方式 ， 只 要 代码 结构 合理 , 将 代码 改写 为 男 一 种 方式 都 不 困难 。 


















































12.3.3 ”编译 驱动 代码 


我 们 需要 将 jp_driver.c 文 件 编译 成 一 个 共 胖 库 〈 在 UNIX 下 叫 共享 目标 文件 ， 在 Windows 下 则 
叫 动态 链接 库 )。 因 此 gcc 的 命令 行 参 数 会 略 有 不 同 。 请 在 命令 行 中 执行 以 下 命令 : 
gcc -oO ./priv/jJp_ driver.so -fpic -shared -IS{OTPROOT}/erts-5.7.5/include 
-IS{OTPROOT}/1l1ib/erl interface-3.6.5/include -IS{YAJLROOT}/include 


-LS{OTPROOT}/1ib/erl interface-3.6.5/1ib -LS{YAJLROOT}/1ib 
./C_src/jJp_ driver.c -lei st -lyajl 


在 Mac OS X 下 ， 需 要 将 -sharedq 蔡 换 成 -bundle -flat namespace -undefined 
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suppress: 


gcc -Oo ./priv/jJp_ driver.so 
-fpic -bundle -flat namespace -undefined suppress 
-IS{OTPROOT}/erts-5.7.5/include 
-IS{OTPROOT}/1ib/erl interface-3.6.5/include -IS${YAJLROOT}/include 
-LS{OTPROOT}/1ib/erl interface-3.6.5/1ib -LS{YAJLROOT}/11ib 
./C_src/jJp_driver.c -lei st -lyajl 


请 拿 上 述 命令 与 12.2.3 市 中 给 出 的 命令 行 做 一 个 比较 。 除 了 源 文件 和 目标 文件 ( 分别 是 ce_sre/ 
jp_driver.c 和 priv/jp_driver.so ) 有 所 不 同 以 外 ， 还 多 出 了 -fpic 和 -shared 参 数 ， 以 及 erl_driver.h 
头 文件 所 在 的 包含 路 径 ${OTPROOTY/erts-5.7.5/include。 .so 是 大 部 分 类 UNIX 平 台 下 共享 库 的 标准 
扩展 名 ，Windows 下 则 是 .dll。 

链 入 式 驱 动 代 码 的 C 语 言 部 分 就 此 迁移 完毕 。 整 个 过 程 主要 是 为 了 修改 驱动 程序 与 Erlang VM 
则 的 数据 交换 手段 而 编写 了 一 些 包装 代码 。 接 下 来 ， 还 需要 对 Erlang 代 人 码 作 出 一 些 调 整 。 

















12.3.4 ”驱动 的 Erlang 部 分 


为 了 使 用 链 入 式 驱 动 ，Erlang 部 分 也 需要 作出 一 些 修 改 。OTP 应 用 的 总 体 结构 不 用 变 , 但 用 
于 管理 端口 的 gen server 必 须要 改 。 

当前 的 jp_server( 参见 12.2.1 节 ) 调 用 了 open_port ({spawn, Name}, Options), 其 中 Name 
是 某 个 可 执行 文件 的 路 径 。 随 后 ，Erlang VM 将 负 员 局 动 外 围 程序 并 将 它 的 标准 输入 输出 流 与 端 
口 对 接 ， 一 旦 发 现 外 围 程序 终止 就 关闭 问 口 。 很 商 单 。 

在 使 用 链 入 式 驱动 时 ， 启 动 端口 的 命令 没有 变 , 但 C 库 的 加 载 和 链接 却 得 由 你 来 保证 了 。 用 
于 加 载 和 打开 端口 的 代码 如 下 : 











case erl Gdll:load(PrivDir, "jp Griver"™) of 
ok -> OK: 
Other -> exit (Other) 

end, 

open port{{spawn, JP Griver"}, [binaryl]) 


此 处 的 要 点 在 于 共享 库 文件 的 定位 和 加 载 。 和 此 前 的 外 部 可 执行 程序 一 样 , 应 该 将 库 文件 安 
置 在 应 用 的 priv 目 录 (或 其 子 目 录 ) 下 。 有 了 这 一 约定 ， 只 需 调 用 code:priv_dir (AppName) 
便 能 迅速 定位 目标 目录 ， 人 参见 12.2.1。 

加 载 共 至 库 时 调用 的 是 erl_qdd11:1oad (Path，Name) (注意 有 两 个 da )， 其 中 Path 是 库 文 
件 所 在 目录 的 路 径 ，Name 是 无 扩展 名 ( 通 稼 是 .so 或 :dl ) 的 文件 名 。 文 件 名 必须 与 ErIDrvEntzy 
结构 体 中 定义 的 ariver_name 相 同 。 如 果 调 用 返回 ok ， 就 表示 一 切 正 常 ， 可 以 继续 打开 端口 。 
对 于 链 入 式 驱 动 来 说 ，exit_status 喘 口 选项 没有 意义 (用 于 处理 退出 状态 人 码 消 朋 的 
handle_info 回 调 也 没 必 要 了 )。 同 样 ，{packet,N} 选 项 也 没 用 了 erl driver API 已 经 将 数 
据 的 长 度 告诉 你 了 。 除了 这 些 以 外 , open_port 调 用 看 起 来 与 此 前 针对 外 围 程序 的 版 本 并 没有 什 
么 两 样 ， 只 是 在 调用 参数 中 指定 的 名 称 不 再 是 文件 路 径 ， 而 是 用 于 标识 待 加 载 驱 动 的 字符 串 。 

按 12.3.3 市 的 描述 编译 好 C 代 人 码 , 就 可 以 开始 测试 链 入 式 驱 动 了 。 运行 Erlang、 启动 json_parser 
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应 用 、 调 用 json_parser:parse_document/1， 整 个 过 程 与 12.2.3 市 如 出 一 略 。 作 为 用 户 ， 除 
了 执行 速度 有 所 提升 以 外 ， 应 该 感觉 不 到 任何 差异 。 

至 此 ， 原 本 实现 成 外 围 程序 的 JSON 解 析 冀 就 被 完全 改造 成 链 和 人 式 驱 动 了 。 通 信 不 再 需要 标 
准 VWO， 而 是 通过 C API 调 用 下 接 完 成 数据 交换 。 这 种 方式 通过 减少 路 进程 数据 传递 有 效 地 提升 了 
Erlang 与 外 围 代 人 码 间 的 通信 效率 。 速 度 的 问题 终于 解决 了 了，Erlware 的 同仁 们 非常 满意 。 


12.4 将 解析 器 实现 为 NIF 


NIF 在 Erlang 中 还 是 个 新 事物 ， 跟 端口 类 接口 有 所 不 同 。 和 端口 驱动 一 样 ， 它 们 采用 以 回调 
为 基础 的 C API; 但 在 Erlang 看 来 它们 跟 普 通 Erlang 郴 数 没 有 什么 区 别 ， 跟 端口 没有 任何 关系 。 
erl_nif API 自 有 一 套用 在 Erlang 和 C 之 间 传 递 数据 结构 的 函数 ， 并 不 使 用 外 部 项 式 格式 。 因 此 
端口 驱动 代码 中 可 重用 于 NIF 的 部 分 相对 较 少 。 带 来 的 收益 则 是 速度 的 提升 和 实现 的 人 简化。 

在 本 节 的 示例 中 , 你 将 用 NIF 接 入 JSON 解 析 融 库 。 为 了 把 握 NIE 的 概念 , 我 们 先 来 实现 Erlang 
这 边 的 NIF 代 码 。 


























12.4.1 NIF 的 Erlang 部 分 


在 用 NIF 实 现 JSON 解 析 侣 接口 时 ， 不 再 需要 用 gen server 打 开端 口 一 一 所 有 功能 将 由 
json_parser 模 块 直接 提供 。 使 用 之 前 也 没 必 要 启动 应 用 ， 因 此 也 不 需要 监督 树 。jp app、jp_sup 
和 jp_server 这 几 个 模块 部 可 以 省 了 。 该 应 用 就 是 一 个 简单 的 库 应 用 ，ebin/json_parser.app 可 以 何 化 
如 下 : 


{application, JjJson parser., 
[ {Gescription, "JSON parser {using NIFs)})"}, 
{ven, "0O.1.0"}, 
{modules, [json parser]}, 
{applications, [kernel, stdlib]} 
] }. 


所 有 Erlang 代 但 都 位 于 json_parser 模 块 内 ， 所 需 完成 的 功能 也 很 筒 单 。 首 先 ， 必 须 实 现 一 个 
用 于 加 载 共 享 对 象 的 图 数 。 如 下 所 示 : 
init{}) -> 
Case code:priv_dir(?APPNAME}) of 


{error, _} -> 
error logger:format ("~w PrIv dir not found~n", [?APPNAME])}), 











exit (error}): 
PIrIivDir 一 > 
erlang:load nif (filename:jJoin({( [PrivDir, "JpP nifs"])}, 0) 





end. 


调用 erlang:1loaa_nif(Path，LoadIinfo) 将 加 载 并 链接 Path ( 无 文件 扩展 名 ) 指定 的 共 
享 库 文件 ， 然 后 就 可 以 像 调 用 普通 Erlang 据 数 一 样 调用 NIF 了 。LoadInfo 参 数 将 被 传递 给 lo0ad 
回调 ( 稍 后 解释 )， 可 用 于 处 理 版 本 升级 等 事务 。 在 本 例 中 ， 传 和 人 0 即 可 。 

不 过 ， 如 果 每 次 调用 NIF 函 数 之 前 都 得 先 调 用 init () 那 可 就 太 糟 糙 了 。 是 和 否 使 用 NIF 是 函数 
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目 导 的 实现 细 市 ， 对 用 户 来 说 应 该 是 不 可 见 的 。 好 在 这 个 问题 可 以 用 与 erl_nif API 同 期 加 入 
Erlang 的 -on_load(...) 模 块 属性 来 解决 。 以 下 声明 表示 每 当 Erlang YM 加 载 该 模块 时 都 应 目 动 
调用 init7/0 困 数 : 

-on_load (init/0). 
这 样 就 可 以 保证 所 属 模块 一 经 加 载 NIF 就 日 动 可 用 ， 用 户 不 会 发 现 消 数 的 真 遇 是 NIF。 

最 后 ， 还 得 为 NE 导出 一 个 桩 函数 一 一 在 本 例 中 这 个 函数 融 是 parse_qocument7/1: 


parse document (Data) 一 > 














erlang:nif errorf(nift not loaded)}). 


NIEF 库 加 载 后 ， 对 应 的 NIF 实 现 将 会 蔡 换 上 述 的 Erlang 版 本 。 


在 桩 函数 中 调用 erlang: nif error/1I 

此 处 调用 内 置 函 数 erlang:nif_error/1 有 两 个 目的 : 首先 ,如果 NIF 库 尚 未 加 载 就 调 
用 了 NIF 函数 ， 它 会 抛 出 运行 时 错误 。 在 这 种 情况 下 ，erlang:nif_ error/1 与 
erlang:error/1 完全 一 样 。 其 次 ， 是 为 了 提示 Dialyzer 等 代码 分 析 工 具 这 段 Erlang 代码 并 
不 代表 该 函数 的 实际 行为 (要 等 到 NIF 库 加 载 之 后 才能 得 以 体现 ) 。 如 果 不 这 么 做 ，Dialyzer 
会 认为 这 个 函数 总 是 抛 出 弄 常 从 而 就 该 函数 发 出 警告 , 基于 上 述 原 因 , 实现 NIF 桩 函数 时 应 该 


erland niflerror/ 1 





准备 束 绪 后 ， 剩 下 的 工作 就 是 构建 由 json_parser:init () 加 载 的 共 圣 库 priv/jip_nifs.so 了 。 


12.4.2 NIF 的 C 代 码 部 分 


请 将 12.3 节 中 实现 的 c_ src/jp_driver.c 复 制 一 份 ， 更 名 为 ec_src/jp nifs.c。 虽 有 不 少 雷 同 之 处 ， 
但 还 是 有 不 少 地 方 要 改 。 
首先 ， 文 件 开头 处 包含 的 erl driver.h 和 ei.h 应 换 成 erl nif.h: 


#ijnclude <erl nif.h> 





drv_start\drv_stop\drv_output make error 下 数 和 j pP_driver entry.、drv_data t 
结构 体 ， 还 有 DRIVER_INIT 宏 ， 统 统 删 掉 。 

1. Erl1NifEnv 环 境 

在 链 入 式 驱 动 中 ， 实 例 专 有 信息 必须 保持 在 自 定义 的 结构 体 中 。 而 使 用 NIF 时 ，Erlang VM 
会 向 你 的 C 函 数 传 入 一 个 被 视 作 句柄 的 Erl1NifEnv 对 象 指针 ， 后 续 用 到 的 大 部 分 erl_nif API 函 
数 都 会 用 上 这 个 句柄 。( 有 关 er1_nif API 的 详情 请 参见 Erlang/OTP 文 档 中 的 ERTS 参 考 手册 。 ) 
为 了 将 该 句柄 传 入 YA 了 L 解 析 絮 回调 函数 ， 就 必须 把 它 存 入 state_t 结 构 体 。 出 于 某 种 原因 (后 
续 说 明 )， 状 态 结构 体 中 还 得 保存 一 个 标志 变量 ， 用 于 指示 YA 开 解 析 需 解析 的 上 一 个 元 素 是 否 ， 
某 键 / 值 对 中 的 键 。 因 此 ，state_t 结 构 体 的 定义 中 得 加 上 这 么 两 行 : 


ErlNifEny *enyv: 

















int KE; 
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另外 ， 由 于 不 再 需要 调用 ei 库 来 构建 项 式 ， 请 删除 下 面 这 行 

ei x_buff x; 
详情 见 下 。 

2. 内 存 管理 

在 链 入 式 驱 动 中 ， 必 须 用 erl driver 库 提供 的 ariver_alloc 等 困 数 来 分 配 内 存 。 在 NE 中 ， 
则 必须 换 用 erl_nif 库 提供 的 enif_alloc 等 图 数 。 这 些 困 数 的 第 一 个 参数 都 是 Erl1NifEnv， 因 此 
必须 将 它 设置 为 内 存 分 配 也 数 的 上 下 文 。 请 在 函数 parse_json 中 调用 yaj1_alloc 之 前 的 位 置 


alloc funcs.ctx = st->env; 


(alloc_funcs 结 构 体 中 的 这 个 字段 原本 是 NULL。 ) 











注意 0U ErlangOTP RI4D ONIF APODOOD0O0000000RB30000000000 
UDUDUUUDU enif alloc UDUUUDUDEriNiftanv UUUDUUUUUUUUD 
R14UDUUUUUUD 





接 下 来 ,分 别 用 以 下 调用 蔡 换 YA 于 内 存 分 配 包装 果 数 中 的 dariver_alloc aqriver_realloc 
driver free， 


enif alloc( (ErlNifEnv *)ctx, sz) 
enif_realloc( (ErlNifEnv *)ctx, ptr, sz) 
enif free( (ErIlNifEnv *)ctx, ptr) 


YA 开 解 析 融 回调 函数 中 的 内 存 分 配 逻 辑 也 要 作出 相应 修改 ， 不 过 这 几 个 函数 后 续 几 乎 要 完 
全 重 写 ， 这 些小 的 修改 此 处 就 不 再 费 述 了 。 

3. 跟踪 容器 内 容 

用 erl_nif 库 替换 ei 库 并 不 简单 ， 没 有 了 ei 中 的 ei_x_pbuff， 就 无 法 增 量 构建 用 于 表示 数组 和 
映射 的 Erlang 项 式 了 。 用 sr1_nif 创 建 列 表 和 元 组 时 ， 必 须 事 先 将 项 式 的 大 小 告知 相关 函数 ; 代 
人 码 清单 12-7 中 那 种 事后 补 填 元 素数 目的 手法 在 此 失效 。 不 过 办 法 还 是 有 的 : 可 以 先 将 项 式 存 人 C 
数组 8 然后 用 erl nif 中 的 eni f_make_ tupl e_from array 利 enif make list from array 
消 数 一 次 性 将 C 数 组 转换 成 所 需 的 元 组 或 列表 。 这 样 一 来 , 只 需要 在 JSON 容 徊 的 解析 过 程 中 做 好 
相关 数组 的 维护 工作 即 可 。 为 此 ,container_t 结 构 体 中 还 需要 再 加 两 个 字段 , 分 别 是 arraysz 
和 arrav: 























typedef struct container t { 
jnt count:; /x+ number of elements +*/ 
int arraysz; /* Size of elements array */ 
ERL NIF TERM *array; /* elements array */ 
Struct contajner tt *next.; 

} container _t; 


另外 ，indqex 宇 段 已 经 疫 用 了 ， 可 以 删除 。 
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4. NIF 实 现 函 数 

现在 我 们 来 看 用 于 实现 NIF 的 C 上 负数 。 由 于 对 应 的 Erlang 哺 数 名 为 parse_document et 位 于 
json_parser 模 块 内 )， 因此 我 们 将 该 C 孙 数 取 名 为 parse_document_1。 该 限 数 将 取代 先前 版 本 中 
的 process_qdata 子 数 。 相关 代码 如 代码 清单 12-11 所 示 , 其 中 也 包括 了 用 于 将 NIF 接 入 Erlang VM 
的 声明 。 


代码 清单 12-11 c src/jp nifs.c: NIE 实 现 晒 数 
static ERL NIF TERM parse document 1 (ErINifEnv *env, int arge, 
Const ERL NIF TERM argvl|]) 





























1 
人 0 在 解析 状态 中 保存 NIF 环 境 
St. env GT; 
st.key 0: 


ERL_ NIF_TERM term; 和 设置 虚拟 的 顶层 容器 














container t c = { 0，1，&term NULL }; 
SLC = &o: 





if (argc 1= 1 || lienif is binary (env, argv[0])) 
return enif_ make badarg (env): 


ErlNifBinary bin,; .9 获取 数据 的 地 址 和 长 度 
if (lenif inspect binary (env, argvIi0], &bin)) 
return enif make badarg (env); ey a 
CONnst char *err; Sm 
if fferr = parse json{(&st, bin.data, bin.size}}) = NULL) f 
return enif make tuple2 (env, enif make atom(env, "error"), 
enif make stringl(env, err, BERL NIF LATIN1)); 





} 
return enif make tuple? (env, enif make atom(env, "ok"), term); 


oe Erl]NifrFunc json parser NIFs[] = { 

{"Parse document", 1], &parse document 1} 6 罗列 所 有 NIF 

3 

ERI NIF INIT(json parser, json parser NIFs, NULL, NULL, NULL, NULL); 

所 有 NIF 实 现 函 数 的 签名 都 是 一 样 的 : 接受 3 个 参数 ， 并 返回 一 个 ERL_NIF_TERM 对 象 (在 
erl_nif API 中 定义 )。 第 一 个 参数 env 就 是 前 面 提 到 过 的 ErlNifEnv 指 针 。 将 之 存 人 state_t 
结构 体 以 便 后 续 访 问 和 @@. 第 二 个 参数 argc 是 Erlang 调 用 NIF 时 传人 的 参数 数 日 。( 这 样 便 可 以 用 单 
个 C 函 数 实现 多 个 Erlang NIF。) 最 后 ， 数 组 argv 中 的 元 素 就 是 传人 的 各 个 参数 (数目 与 argc 中 
的 一 致 )。 

此 前 , 解析 结果 是 用 ei 库 的 ei_x_buff 来 构建 的 ，NIF 则 不 同 。NIF 哨 数 的 返回 值 类 型 是 用 于 
表示 Erlang 返 回 数据 的 ERL_NIEF_TERM。 为 了 保存 JSON 解 析 回 调 返回 的 解析 结果 项 式 ， 需 要 事先 
设置 一 个 虚拟 的 顶层 container_t 结 构 体 侈 。 该 结构 体 中 仅 有 一 个 项 式 ， 由 变量 term 保 存 ， 相 当 
于 一 个 仅 含 单个 元 素 的 C 数 组 ; 最 后 ， 一 切 正常 的 话 ,， 将 term 中 的 值 装 和 人 二 元 组 {ok，. . .} 返 回 。 

一 般 来 说 ， 在 执行 具体 功能 之 前 ， 应 该 先 对 NIF 函 数 参数 的 数量 和 数据 类 型 进行 检查 。 本 例 
中 (唯一 的 ) 参数 应 该 是 个 二 进 制 串 ; 如 有 果 不 是 ， 就 应 该 返回 一 个 专门 用 于 触发 badarg 异 常 的 
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ERL_NIF_TERM 值 来 通报 运行 时 错误 。 

在 开始 解析 之 前 , 必须 先 从 二 进 制 串 中 找 出 实际 的 JSON 数 据 。 调 用 enif_inspect_pbinary 
并 传 入 一 个 ErlNifBinary 结 构 体 ， 便 可 取出 待 解析 的 JSON 数 据 合 。 有 了 这 个 ErlNifBinary 
结构 体 ， 就 可 以 像 之 前 一 样 调用 parse_json 函 数 了 人 全。 如果 解 析 结 果 是 个 错误 字符 串 ， 则 问 
Erlang 返 回 {error，String} 大 组 。 

5. 注册 NIF 

处 理 完 上 述 事务 , 还 得 准备 一 个 ErlNifFunc 数 组 , 这 样 Erlang VM 才能 获知 库 中 实现 的 NIF。 
数组 中 应 逐一 填 和 人 各 NIE 的 Erlang 函 数 名 和 元 数 以 及 对 应 的 C 实 现 函 数 合 。 此 外 ， 还 必须 调用 
ERI_， NIF_INIT 宏 将 该 数组 连同 这 批 NIE 函 数 所 属 模块 的 模块 名 一 同 告知 Erlang VM。( 请 注意 ， 
模块 名 json parser 不 市 引号 。) 

ERI_ NIF_INIT 的 后 4 个 参数 是 指向 NIF 生 存 期 管理 函数 的 国 数 指针 ， 可 以 按 需 选用 。( 本 例 
中 全 部 置 为 NULL 即 可 。) 按照 在 ERL_NIE_INIT 宏 中 的 出 现 次 序 ， 这 4 个 郴 数 分 别 是 1oad、 
reload、upgrade 和 unload。 其 中 1oad 在 NIF 被 载 人 系统 时 调用 ，unload 在 NIF 即 将 从 系统 中 
印 载 时 调用 ; reload 气 数 在 NIF 重 新 载 人 时 调用 ，upgrade 消 数 则 在 对 NIF 气 数 执行 运行 时 代码 升 
级 时 调用 。 在 本 例 中 ， 我 们 暂时 用 不 上 这 些 也 数 。 

6. 重 写 YAJL 解 析 器 回调 

将 JSON 解 析 器 改造 成 NIF 的 最 后 一 步 就 是 重 写 YAJL 的 解析 器 回调 函数 ,此 前 我 们 采用 ei 库 将 
解析 结果 编码 成 Erlang 数 据 ， 现 在 则 必须 换 用 工作 方式 锭 异 的 erl_nif API。 因 此 大 部 分 回调 代 
但 都 没 法 重用 , 必须 重 写 .所 芋 ,这 些 改动 多 半 都 还 算 简 单 ,差别 较 大 的 主要 是 hana1l e_map_key.、 
handle start 和 和 handle _ end 打数 。 

在 跟 蹊 容 硕 中 的 元 素 时 ， 策 略 也 得 改 改 : 计数 就 不 必 了 ,但 需要 把 每 个 元 系 都 存 入 自行 分 配 
的 临时 数组 。count_element 工 具 困 数 将 被 蔡 换 成 更 为 复杂 的 adqdq_element 国 数 ， 该 图 数 以 解 
析 希 状态 和 符 添 加 的 项 式 为 输入 参数 ， 如 代码 清单 12-12 所 示 。 
代码 清单 12-12 c src/jp nifs.c: aaddq_element 工 具 困 数 


static Vvoid addq_element (state t *st, ERL NIF TERM t) 
{ 
container 七 *c = 
jf (fc != NULL) { 
if (c->count >= c->arraysz) f{ A 
































St— 30 


C->arraysz 和 
C->array = enif realloc(st->env, CcC->array, C->arrayszZ); 
} 
if (st->key) { 
cc->array[c->count-1] = 处 理 完整 的 键 / 值 对 
enif make tuple2 (st->env, c->array[c->count-1], t); 和 
StL->Keyv = 0; 
} else { 
=>ariaY [CcC-S00Unt] = tt; » 处 理 其 他 元 素 


++ (CC—->COoOuUnNnt}): 
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起 初 , 每 个 容 表 中 的 元 素数 都 是 去 ,并且 附 之 一 个 较 小 的 预 分 配 的 数组 用 于 存储 加 入 容 融 的 
元 素 。 当 数组 不 足以 容纳 新 加 入 的 元 素 时 ， 对 数组 进行 扩容 @@。 接 下 来 分 两 种 情况 ， 如 果 新 加 入 
的 元 素 是 键 / 值 对 中 的 值 ( 可 通过 检查 st->key 字 上 段 得 知 ), 则 上 一 个 加 入 数组 的 元 素 是 对 应 的 键 ， 
这 时 应 该 将 键 从 数组 中 取出 ， 然 后 键 和 值 重组 为 一 个 二 元 组 ， 再 放 回 数组 。 这 种 情况 下 元 素 计 数 
不 应 再 次 递增 ， 否 则 就 重复 了 ， 不 过 必须 重 置 key 标 志 位 @O。st->key 标 记 为 零 的 情况 就 简单 多 
了 : 只 需 将 项 式 插 入 数组 当前 位 置 并 递增 元 素 计数 即 可 合 。 

有 了 这 一 机 制 ， 用 erl_nif API 重 写 YA 开 回调 就 简单 多 了 ， 如 代码 清单 12-13 所 示 。 


代码 清单 12-13 c src/jp nifs.c: 新 版 的 简单 YA 开 回 调 


static int handle null {void *ctx) 

















{ 
state t *st = (state 七 *)ctx; 
add element (st, enif make atom(st->env, "undefined"}))}).; 
return 1; 
} 
static int handle boolean{(void *ctx, int boolVal) 
{ 
state t *st = (state t *)}ctx; 
if (boolVal) { 
add _ element (st, enif make atom(st->env, "true"))}):; 
} else { 
add element (st, enif make atom(st->env, "false")); 
} 
return 1; 
} 
static int handle integer(void *ctx, long integerVal) 
{ 
state t *st = (state 七 *)}ctx; 


add_ element {st, enif make long{st->env, integerVval)).; 
return 1; 


} 
static int handle doublel(void *ctx, double doubleVal) 
{ 

state t *st = state 七 *})ctx; 


add _ element (st, enif make double(st->env, doubleVal)}: 
return 1; 


} 


static int handle_ string(void *ctx, const unsigned char *stringVal, 
unsigned int stringLen) 








{ 
state 七 *st = (state t *})ctx:; 
ErlNifBinary bin; 





enif alloc binary (st->env, stringLen, &bin}); 
strnopy((char *}bin.data, (char *})stringVal, stringLen):; 
add_element (st, enif make binary (st->env, &bin)): 

return 1; 
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static int handle map_key {void *ctx, const unsigned char xstrInoVal ， 
unsigned int stringLen) 
{ 
state 七 *st = (state 七 *)ctx;} 
ErlNifBinary bin; 
enif alloc binary (st->env, stringLen, &bin},; 


strncpy( (char *}bin.data, (char *}stringVal, stringLen}); 
add _ element (st, enif make binary (st->env, &bin)): We 
st->key = 1; 


return 1; 


} 

仔细 观察 就 会 发 现 ， 这 些 函 数 都 遵循 相同 的 模式 ， 先 用 enif_ 等 靖 数 创建 Erlang 项 式 青 调用 
addq_element 将 之 插入 当前 容 需 。 你 应 该 还 记得 , 在 parse_dqocument_1 困 数 (代码 清单 12-11 ) 
中 曾经 创建 了 一 个 虚拟 的 顶层 容器 ， 因 此 不 用 担心 没有 容 需 保存 这 些 元 素 。 比 较 值 得 注意 的 是 
handle_map_key 函 数 , 它 首先 将 键 当 作 普 通 字 符 串 插入 ， 然 后 再 做 好 标记 , 注 明 刚刚 插入 的 是 
键 / 值 对 中 的 键 ， 这 样 下 一 个 元 素 才 能 得 到 正确 的 处 理 @。 

最 后 , 代码 清单 12-14 展 示 了 新 版 本 的 JSON 容 器 回调 , 这 些 回 调 分 别 负责 处 理 JSON 数 组 和 映 
射 的 头 尾 。 出 人 意料 的 是 ， 作 为 本 章 的 最 后 一 段 代 码 ， 这 几 个 函数 极其 简单 明了 。 

















代码 清单 12-14 c src/jp nifs.c: 新 的 YAJL 容 带 回 调 


static int handle start (void *ctx, int array) 


{ 
state t *st = {state t *}ctx:; 
container t *c = enif alloc{st->env, sizeof (container 七 ) ) ; 
eek 分 配 容器 结构 体 、 
St->c = CC; J oe J 
和 将 之 链 入 解析 器 状 
C->COuUNnt = 0; 态 并 完成 初始 
下 汪汪 天 态 并 完成 初始 化 
C->arraysz = 32 /xx nitial term buffer size */ 
CcC->array = enif alloc(lst->env, CcC->arraysz);) 


return 1; 


} 


static int handle start map (void *ctx) 


' 


return handle start ‘ctx, 0): 


} 


static int handle start array (void *ctx) 
{ 
return handle start {ctx, 1): 


} 


static int handle end{(void *ctx, int array) 


{ 


state 七 *st = {state t *}ctx; 
container t *c = st->c; 从 解析 器 状态 中 摘 
St >cC = CC—>nNext: 除 容 器 


if (array) { 
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add_element (st, enif make tuple_ from array (st->env, CcC->array, 
C->Count)}).: 
} else ({ 
add _ element {st, enif make list from array (st->env, c->array, 
C->Count})}):; 





} 
enif freelst->env, CC}; 
return 1; 


} 创建 并 添加 Erlang 


列表 /元 组 
static int handle end map (void *ctx) 

{ 

return handle end{ctx, 0); 


} 


三 


static int handle end array (void *ctx,) 


‘ 


return handle endl{lctx, 1}).， 


} 

解析 JSON 数 组 或 映射 的 开头 时 ，nandle_start 会 (调用 enif_alloc ) 分 配 一 个 新 的 容 
侣 结构 体 ， 将 之 链 入 解析 带 状 态 ， 并 完成 初始 化 。 它 还 会 预 完 分 配 一 个 相对 较 小 的 数组 ， 用 于 存 
储 容 器 中 的 元 素 ， 必 要 时 adq_element 还 会 调整 数组 的 大 小 @@。 

调用 handaqle_endq 时 ，JSON 数 组 或 映射 中 的 元 系 已 经 全 部 装 入 容 需 结构 体 中 的 C 数 组 。 接 下 
来 ,将 该 容器 从 解析 器 状态 中 摘除 ， 这 样 后续 新 的 元 组 或 列表 才能 进入 外 层 容 需 @ 转 。 然 后 ， 调 用 
enif_make_tuple_from array 或 enif_make_ list_from array 将 C 数 组 转换 成 Erlang 项 式 
合 ， 再 将 之 放 入 新 的 当前 容器 。 至 此 ， 先 前 使 用 的 容 带 结构 体 就 可 以 释放 了 。 








12.4.3 编译 与 运行 代码 
请 用 以 下 命令 行 调用 gcc 编 译本 节 中 的 C 代 码 ; 


S gcc -oo ./Priv/]P nifs.so -fpic -shared -IS{OTPROOT}/erts-5.7.5/include 
-TVATLROOLTY /include. = 下 TS] 


和 jp_driver 一 样 ，Mac OS X 下 的 命令 行人 参数 略 有 不 同 : 
gcc -Oo ./priv/jJp_nifs.so -fpic -bundle -flat namespace -undefined suppress 


-IS{OTPROOT}/erts-5.7.5/include 
=TSTYATEOROOTT nelode <LS{YAmILROOT}Y/IIE Ze sre/jb nifs.e =lyaijl 


和 端口 驱动 代码 的 处 理 方法 类 似 ,，NIF 也 要 编译 成 共享 库 。 与 12.3.3 市 中 的 编译 命令 相 比 , 除了 源 
文件 和 目标 文件 不 同 以 外 ， 另 一 个 差异 就 是 这 里 省 去 了 erl interface 库 的 头 文件 路 径 和 库 文件 路 
径 。 竺 priwWjp_nifs.so 就 绪 后 ，12.4.1 节 中 的 代码 应 该 就 可 以 工作 了 。 正 如 我 们 在 本 节 中 曾经 说 明 
过 的 那样 ,现在 用 于 对 接 JSON 库 的 代码 全 都 包含 在 json_parser 模 块 内 了 , 模块 加 载 时 会 自动 设置 
并 加 载 NIF 库 。 使 用 NIF 函 数 前 无 须 启动 任何 应 用 ， 如 下 所 示 : 


$ erl -pa ../json parser/ebin 


1> Doc = <<"[null, true, {\"int\": 42, \"float\": 3.14}] ">>. 
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2> json parser:parse _ document (Doc ) . 
{ok, {undefined,true, [{<<"int">>,42}, {<<"float'">>,3.14}]}} 
3> 


至 此 ， 本 章 就 要 告 一 段落 了 。 我 们 介绍 了 3 种 在 Erlang 中 集成 外 围 代 码 的 方法 ， 并 讨论 它们 
各 目的 优 缺 点 。 就 NIF 而 言 ， 一 大 缺点 就 在 于 并 发 性 不 足 : NIE 调 用 会 阻 堵 发 起 调用 的 调度 规 ， 
直至 NIF 返 回 为 止 。 如 果 你 用 的 是 典型 的 每 个 CPU 一 个 调度 器 的 Erlang 系 统 ， 那 就 意味 着 在 NIF 调 
用 结束 前 对 应 的 CPU 无 法 运行 其 他 Erlang 进 程 。 如 果 只 是 直接 调用 外 围 代码 写成 的 库 而 且 能 够 快 
速 返回 ， 用 NIF 就 再 适合 不 过 了 。 至 于 JSON 解 析 需 是 不 是 适合 采用 NIF ， 这 就 要 看 应 用 场景 了 : 
在 解析 大 型 文档 时 ， 系 统 的 啊 应 度 会 有 所 降低 ， 但 否 吐 量 应 该 会 很 好 。 
































12.5 小结 


我 们 在 本 章 中 讨论 了 3 种 Erlang 与 外 于 代码 通信 的 基本 方法 。 从 安全 性 出 发 ， 通 过 问 口 授信 
外 围 程序 是 最 为 稳 葡 的 方案 , 而 且 无 须 开 发 额外 的 C 代 人 码 就 可 以 直接 调用 大 部 分 UNIX 程 序 , 只 是 
在 部 分 情况 下 性 能 方面 可 能 会 拖 后 腿 。 如 末 确 实 有 必要 退 求 速度 ， 那 么 可 以 选用 链 入 式 驱 动 或 
NIF， 至 于 到 左 该 用 哪个 ， 这 取决 于 更 次 层次 的 需求 一 一 比如 C 代 码 中 是 否 会 出 现 寞 步 IO 操 作 等 。 

不 过 并 不 是 所 有 人 虱 会 C， 近 年 来 Java 的 应 用 也 顾 为 广 沁 。 要 是 能 够 红 开 C， 下 接 用 Java 与 
Erlang 通 信 ， 那 该 多 好 。 在 下 一 章 中 ， 我 们 将 对 另 一 种 外 围 代 码 通信 方式 进行 探讨 ， 它 就 是 Java 
节 感 。 
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用 Jinterface 实 现 Erlang 和 
Java 上 加 的 通信 


本 章 概 要 

口 用 Jinterface 与 Java 程 序 通 信 

口 桥接 Erlang 与 HBase 数 据 库 之 间 的 桥架 
口 将 HBase 集 成 至 Simple Cache 应 用 中 








在 上 一 章 中 ,我 们 探讨 了 如 何 利 用 Erlang 端 口 来 集成 外 围 代 码 。 这 种 方法 既 实 用 又 通用 ,但 
却 未 必 是 最 为 便利 的 手段 。 本 章 我 们 将 另辟蹊径 ， 将 外 围 代码 伪装 成 一 个 Erlang 节 点 ， 直 接 采 用 
Erlang 分 布 式 协议 〈 人 参见 第 8 草 ) 与 Erlang 通 信 。 好 在 Erlang 语 言 的 开发 者 们 已 经 做 了 大 量 铺垫 ， 
为 C 和 JavaT 点 的 开发 提供 了 民 好 的 库 文 持 ， 使 得 这 部 分 工作 得 以 简化 。 

经 过 本 书 第 2 部 分 的 打磨 ， 我 们 开发 的 缓存 应 用 已 经 可 以 适用 于 企业 应 用 环境 了 ， 越 来 越 多 
的 个 人 和 组 织 开 始 将 它 应 用 到 上 自己 的 项 目 之 中 。 其 中 有 这 人 么 一 个 小 组 ， 他 们 的 数据 不 仅 需要 在 
Mnesia 的 内 存 表 中 保存 ， 而 且 还 要 持久 化 保存 。 按 照 他 们 的 需求 ， 凡 是 插入 缓存 的 数据 基本 上 都 
得 永久 保存 。 磁 盘 型 Mnesia 表 固然 是 一 个 选择 , 但 在 潜在 的 巨大 数据 量 面前 ,这 个 方案 似乎 并 不 
恰当 。 为 了 解决 这 个 问题 ， 我 们 决定 利用 缓存 外 部 的 HBase 集 群 来 存储 缓存 数据 。 

本 章 我 们 先 大 致 讲解 一 下 HBase 的 工作 方式 ， 然 后 学 习 Jinterface 的 工作 原理 并 实现 一 个 基本 
的 Java 世 点 示例 。 在 本 和 草 的 其 余 内 容 中 ， 我 们 将 以 这 些 经 验 为 基础 将 Java 接 人 Erlang， 进 而 实现 
基于 HBase 表 的 Erlang 项 式 存 取 ， 最 后 再 将 这 些 成 采集 成 进 Simple Cache 应 用 。 
































HBase 

HBase 是 出 自 Hadoop 项 目的 一 个 数据 库 ( http://hadoop.apache.org/hbase/ ) 。 它 的 设计 源 
自 Google 的 Bigtable 数据 库 ， 为 大 数据 集 提供 了 快捷 可 靠 的 存储 支持 。HBase 十 分 健壮 ， 存 
储 模型 和 分 布 式 模型 也 很 清晰 。 集 成 了 它 ， 用 户 存 多 少数 据 都 没 问题 。 

缓存 与 HBase 系统 的 交互 过 程 大 致 如 下 : 当 缓 存 收 到 查询 请 求 时 ， 首 先 检查 Mnesia 表 中 
是 否 存 在 待 查 数 据 。 如 果 存 在 ,就 直接 返回 数据 ;否则 便 尝 试 从 HBase 中 读 取 数据 、 插 入 Mnesia， 
再 返回 。 当 收 到 写 请 求 时 ， 缓 存 会 将 数据 同时 写 入 HBase 和 Mnesia。 这 一 版 的 缓存 应 用 不 仅 
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为 用 户 提 供 了 一 套 高 效 的 前 端 内 存 缓 存 , 还 提供 了 一 套 可 靠 的 后 备 存储 系统 。 二 者 之 间 的 关系 


写 入 写 入 持久 化 存储 





读 取 


缓存 位 于 持久 化 存储 的 前 端 。 处 理 读 操作 时 尽 可 能 只 访问 缓存 ， 处 理 写 操 





作 时 则 同时 将 数据 写 入 后 备 存 储 系统 


集成 HBase 的 手段 有 很 多 ， 方 案 之 一 便 是 通过 HTTP 访问 HBase 的 REST 式 API。 不过， 
在 此 我 们 打算 利用 Jinterface 库 直 接 访问 HBase 的 Java API。Jinterface 是 一 个 Java 库 ， 它 能 够 
将 Java 应 用 伪装 成 Erlang 集群 中 的 节点 。 

本 书 关注 的 是 Erlang 和 OTP, 而 非 Java 或 HBase。 因 此 ,我 们 的 讨论 将 集中 于 如 何 将 HBase 
节点 用 作 缓 存 的 存储 后 端 ， 而 不 会 深入 讨论 HBase 或 Java 语言 本 身 。 


13.1 利用 Jinterface 在 Erlang 中 集成 Java 


在 深入 探讨 HBase 及 其 集成 方案 之 前 ， 我 们 先 来 看 一 看 Jinterface。Jinterface 是 一 个 Java 库 ， 
旧 在 计 Java 也 能 访问 Erlang 的 分 布 式 层 。 它 并 没有 有 照搬 Java 的 传统 思路 ， 而 是 尽 可 能 原 计 原味 地 
保留 了 Erlang 的 模型 。 对 我 们 这 些 从 Erlang 转 入 Java 的 人 来 说 , 这 可 是 个 利好 消息 : 从 节点 到 信箱 
再 到 元 组 和 原子 等 各 种 更 细 粒 度 的 对 象 ，Erlang 中 的 每 种 结构 几乎 都 有 一 个 Java 类 与 之 对 应 。 我 


们 将 从 中 挑选 一 些 最 为 关键 的 类 进行 说 明 ， 看 看 它们 到 底 是 如 何 映射 到 Erlang 中 去 的 。 




















13.1.1 OtpNode 类 





Erlang 的 分 布 式 模型 以 相互 连接 的 节点 为 基础 。 在 Jinterface 库 中 ， 节 点 由 OotpNode 类 表示 。 
节点 对 象 可 以 与 其 他 节点 (不 一 定 是 真正 的 Erlang 节 点 ) 连接 和 交互 。 跟 普通 Erlang 节 点 一 样 ， 
用 Jinterface 实 现 的 节点 也 有 节点 名 ， 并 且 也 支持 cookie 认 证 机 制 (参见 8.2.4 节 )。 创 建 otpNoae 
对 象 即 可 局 动 Java 方 点 : 

OtpNode node = new OtpNode ("myJavaNode"™).: 

就 这 么 简单。 如 有 果 字 符 串 包含 字符 @, 那 便 是 完整 节点 名 ， 璧 如 "myNodqeefrodo .erlware. 
org"。 和 否则 ，Jinterface 会 在 名 称 字 符 串 之 后 追加 字符 e 和 本 地 主机 名 ， 从 而 构成 短 贡 点名， 比如 
myNode@frodo。 (我 们 曾经 提 过 ， Erlang 集 群 中 相互 连接 的 各 个 节点 必须 用 同一 种 命名 方式 ， 妥 
么 用 短 节 上 点名， 要么 用 长 节点 名 ， 这 两 种 方式 分 别 对 应 于 局 动 命令 中 的 -sname 和 -name 命 令 行 
参数 。) 编译 代码 的 方法 留待 13.1.4 方 介绍 。 

如 果 需 要 设置 用 于 认证 外 来 连接 的 cookie (参见 8.2.4 节 )， 创 建 节 点 时 还 得 再 加 一 个 参数 : 

OtpNode node = new OtpNode("'myJavaNode", "secretcookie"}).: 


OtpNode 类 隐藏 了 节点 的 底层 通信 和 连接 管理 等 技术 细节 ,有 了 它 , 在 Erlang 集 群 中 集成 Java 
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代码 可 就 简单 多 了 。 不 过 ， 要 想 让 节点 发 挥 作 用 ， 还 得 给 它 配备 一 个 信箱 。 
13.1.2” OtpMbox 类 


有 了 信箱 ，otpNode 节 点 才能 与 集群 中 的 其 他 节点 交互 。 它 们 的 作用 类 似 于 Erlang 进 程 的 信 
箱 ,， 但 却 不 属于 任何 进程 。 仪 从 通信 和 角度 考虑 ， 在 Jinterface 的 模型 中 信箱 标识 符 的 作用 与 进程 标 
识 符 类 似 一 一 即 用 作 消息 传 递 的 目标 地 址 。Jinterface 并 不 负责 线程 管理 ,而 是 全 权 委 托 给 了 开发 
者 ， 此 外 还 允许 直接 访问 信箱 ， 因 此 线程 之 间 也 可 以 采用 消息 传递 进行 通信 。 

言 箱 对 象 由 OtpMbox 对 象 创建 。 如 果 需 要 , 可 以 给 信箱 命名 。 具 和 名 信箱 会 在 本 地 节点 ( 即 Java 
节点 ) 上 注册 ,类 似 于 Erlang 方 点 上 的 注册 进程 ,具名 信箱 可 通过 名 称 接收 消息 ,这 与 经 注册 的 Erlang 
进程 一 样 ; 匿名 信箱 则 只 能 通过 pid 或 信箱 对 象 的 引用 才能 访问 。 具 名 信箱 的 创建 方法 如 下 所 示 : 

OtpMbox named mbox = node.createMbox ("myNamedMbox").: 
创建 匿名 信箱 则 更 为 简单 : 

OPMPox anon mbox = node.createMbox (): 

有 了 信箱 , 便 可 以 收发 消息 了 。 这 里 我 们 将 用 上 otpMbox 类 提供 的 两 个 基础 API: send 和 receive。 
这 两 个 API 还 有 多 个 变 体 ,详情 请 参阅 Javadoc 文 档 ( 参见 www.erlang.org/doc/apps/ jinterface/java/ )。 

俗话 说 入 乡 随 俗 , 在 Java 和 Erlang 间 传递 数据 当然 还 得 用 Erlang 的 格式 。 好 在 Jinterface 已 经 为 

我 们 做 好 了 万 全 的 准备 。 


























13.1.3 “Erlang 效 据 结 构 的 Java 映 射 


节 点 相互 收发 消息 时 ， 消 息 中 的 数据 必须 用 Jinterface 提 供 的 类 型 映射 类 来 表示 。 表 13-1 中 列 出 
的 就 是 各 种 Erlang 数 据 类 型 在 Java 中 的 映 映 类 。 其 中 otpErlangobject 是 折 有 Erlang 类 型 映射 类 的 
父 拓 。 
表 13-1 Jinterface 中 用 于 表示 Erlang 数 据 的 Java 类 


Erlang 类 型 Java 类 
原子 OtpErlangAtom、 OtpErlangBoolean 
二 进 制 串 、 位 串 OtpErlangBinary.、 OtpErlangBitstr 
Fun 呐 数 OtpErlangFun、 OtpErlangExternalFun 
浮 点 数 OtpErlangDouble、OtpErlangFloat 
整数 OtpErlangIint、 OtpErlangLong、 OtpErlangShort、 OtpErlangChar.、 
OtpErlangByte、 OtpErlangUShort.、 OtpErlangUIint 
列表 OtpErlangList、 OtpErlangString 
pid OtpErlangpPid 
山口 OtpErlangport 
引用 OtpErlangRef 
元 组 OtpErlangTuple 
项 式 OtpErlangObject 
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为 了 说 明 这 些 类 的 用 法 ， 下 面 我 们 来 看 几 个 示例 。 前 和 完 以 下 列 Erlang 项 式 为 例 : 

{some_atom, "Some string", 22} 

以 下 代码 负责 将 项 了 式 映 射 到 Java， 再 用 匿名 信箱 将 之 发 送 至 指定 的 具名 信箱 。 唉 ， 就 这 么 点 
儿 逻 辑 ， 用 Java 来 与 还 真是 肪 烦 : 


OtpErlangAtom anAtom 








= new OtpErlangAtom( "some atom").; 
OtpErlangString astring = new OtpErlangSstring("Some string")}); 


OtpErlangInt anInt new OtpErlangInt (22).;， 





OtpErlangTuple aTuple = 
new OtpErlangTuple (new OtpErlangOobject[|] {anAtom, aSstring, anIint})}).: 


anon mbox.send ("myNamedMbox", aTuple); 
可 以 看 出 ，Erlang 数 据 类 型 与 Java 类 之 间 的 映射 顾 为 直截了当 。 需要 特别 注意 的 是 ,在 构建 元 组 、 
列表 等 复合 容 需 对 象 时 应 循序 渐进 ， 必 须 从 容 需 内 的 单个 对 象 人 手 逐 步 构建 。 

现在 ,， 青 反 过 来 看 看 如 何 将 Erlang 数 据 转 换 成 普通 的 Java 对 和 象 。 假设 我 们 的 具名 信箱 收 到 了 
一 条 消息 ( 简单 起 见 ， 此 人 处 略 去 了 消息 结构 分 析 ， 假 定 你 预先 知晓 消息 结构 )， 消 息 解析 过 程 
如 下 : 


OtpErlangOCbject msg = named mbox.recelvel) : 











OtpErlangTuple t = (OtpErlangTIuple) msg; 

String theAtom = ( (OtpErlangAtom) t.elementAt (0)) .atomValue().: 
String theSstring = ((OtpErlangSsString) t.elementAt (1)) .stringVvalue!(}: 
1int theInt = {({(OtpErlangInt) t.elementAt (2)) .intValuel(}.; 


如 果 信 箱 中 存在 未 读 消 息 , receive () 方 法 将 返回 信箱 中 的 第 一 条 消息 , 否则 该 方法 将 持续 
阻塞 下 至 有 新 消息 抵达 为 止 。 该 方法 的 调用 结 末 是 一 个 otpErlangobJject 对 象 ， 可 进一步 转换 
为 更 加 特 化 的 类 型 。 只 要 知道 收 到 的 是 什么 类 型 的 数据 ， 就 不 难 用 Jinterface 将 之 转换 成 原生 Java 
数据 。( 究竟 该 转换 成 什么 类 型 ， 取 决 于 具体 的 数据 处 理 方式 ， 这 就 要 看 你 了 。 ) 

本 章 的 目标 是 用 Jinterface 在 Simple Cache 和 HBase 之 间 建 立 一 个 接口 层 , 如 图 13-1 所 示 。 为 此 ， 
必须 先 搞 清楚 Erlang 和 Java 间 的 通信 和 方式。 后续 两 方 将 用 一 个 完整 示例 分 别 展示 从 Java 到 Erlang 以 
及 从 Erlang 到 Java 的 通信 过 程 。 




















1 下 下 下 TT 1 | 
HBase! 
Simple a I I 
Jinterf -一 HB 
CC (Jinterface | Tava | ase 
| | API | 


攻关 


图 13-1 本草 的 终极 目标 : 让 Simple Cache 通 过 Jinterface 和 HBase Java API 访 问 HBase 表 


13.1.4 示例: Java 中 的 消息 处 理 


以 下 示例 代码 的 功能 如 图 13-2 所 示 : 首先 接收 一 个 内 含 姓 名 子 符 串 和 发 送 方 pid 的 二 元 组 , 再 
癌 发 送 方 回复 一 个 结构 类 似 的 二 元 组 ， 其 中 包含 日 映 信箱 的 pid 和 一 名 问候 二 。 
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Po From Javo 
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图 13-2 ”Jinterface 示 例 的 通信 模式 。 收 到 内 含 名 称 字 符 串 的 消息 后 ，Java 代 码 将 发 回 一 
句 问候 


请 新 建 源 文件 JInterfaceExample.java 并 录入 示例 代码 。 我 们 先 来 看 下 该 如 何 编 译 ， 然 后 再 着 
手 分 析 代 码 。 

1. 编译 Java 程 序 

Java 程 序 的 编译 过 程 就 是 用 javac 将 ,java 文件 转换 为 .class 文 件 的 过 程 。 类 似 于 er1 的 -pa 参 
数 ，java 和 javac 采 用 -cp (class path ) 参数 来 指定 代码 搜索 路 径 。 在 Java 中 ， 无 论 是 编译 程序 
还 是 运行 .class 文 件 ， 都 必须 给 出 .class 文 件 的 搜索 路 径 。( 相 较 之 下 ， 编 译 Erlang 代 码 时 之 所 以 要 
指定 代码 搜索 路 径 只 是 为 了 辅助 编 详 希 检查 行为 模式 声明 ， 并 不 是 必需 的 。) 

javac 和 需要 知道 到 哪儿 才能 找到 随 Erlang/OTP 一 并 安装 到 本 地 的 Jinterface 库 。 该 路 径 一 般 指 
[各 /usr/local/lib/erlang/lib/jinterface-1.5.1/priv/OtpErlang.jar 等 位 置 。 在 继续 学 习 之 前 请 先 在 自己 的 
电脑 上 找到 对 应 的 OtpErlang.jar 文 件 。 

找到 对 应 的 路 径 之 后 ， 请 用 以 下 参数 调用 javac: 

$ javac -cp /path/to/OtpErlang.jJar JIinterfaceFxample.java 
一 切 正常 的 话 ， 当 前 目录 下 应 该 会 多 出 一 个 名 为 JInterfaceExample.class 的 文件 。 如 果 命 令 执行 失 
败 ， 报 钳 声 称 javac not found， 那 么 大 概 是 你 的 机 大 上 没 装 Java Development Kit (JDK ) 的 绿 故 。 
请 从 http://java.sun.com /下载 并 安装 JDK， 然 后 确保 javac 位 于 系统 搜索 日 录 下 ， 并 将 JAVA_HOME 
环境 变量 设置 为 Java 安 装 目 录 的 路 径 。 

2. Java 示 例 代码 

OTP Jinterface 库 的 代码 位 于 com.ericsson.otp.erlang 包 内 。 使 用 它 之 前 ， 必 须 先导 入 这 个 包 : 


impPort com.ericsson.otp.erlang.*,; 


接 下 来 ， 定义 JInterfaceExample 类 : 


Public class JInterfaceExample { 
// all the rest of the code goes here 
} 


其 余 代 码 都 位 于 {和 } 之 间 。, 首先 是 作为 整个 程序 入 口 点 的 main() 方 法 , 它 负 责 创 建 Jjinterface- 
Example 类 的 实例 并 用 命令 行 参 数 调用 该 实例 的 process () 方 法 : 
Public static void main{String[] args) throws Exception { 


if (args.length I= 3) { 
System.out.printlin{'"'wrong number of arguments")}).; 


















































System.out .println{"expected: nodeName mailboxName cookie")}); 
return,; 
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JInterfaceExample ex = new JInterfaceExample(args[0],args[1],args[2]1}): 
ex.Pprocess(});: 


} 
然后 ， 添 加 两 个 成 员 变 量 , 分 别 用 于 表示 市 点 和 信箱 : 


private OtpNode node: 
private OtpMbox mbox:; 


节点 的 初始 化 由 IInterfaceExample 的 构造 果 数 负责 ， 人 代码 如 下 : 


Public JInterfaceExample (String nodeName, String mboxName, String cookie,) 





throws Exception { 
SuDer ()? 
node = new OtpNode (nodeName, cookie); 
mbox = node.createMbox (mboxName):; 


} 
首先 用 指定 的 节点 名 和 安全 cookie 创 建 节点 。 然 后 利用 布点 对 象 创建 具 名 信箱 。 最 后 ， 实 际 
工作 交 由 process () 方 法 完成 ， 它 负责 处 理 消 息 收 发 ， 如 代码 清单 13-1 所 示 。 


代码 清单 13-1 Jinterface 消 息 处 理 示 例 


private void process() { 
while (true) { 
| 
OtpPErlangObject msg = mbox.receive(); 























OtpErlangTuple t = {OtpErljangTuple}) msg; 分 解 元 组 
OtpErlangPiqd from = (OtpErlangPid) t.elementAt (0): 
String name = ((OtpErlangsSstring}) t.elementAt (1})}}) .stringValue!().; 
String greeting = "Greetings from Java, " + name + "1!1"; 
OtpErlangSstring replystr = new OtpErlangstring (greeting).; 
OtpErlangTuple outMsg = 

new OtpErlangTuple (new OtpErlangObject[] {mbox.self({), 

replystr}); 
mbox.sendlfrom, outMsg): 
} ateh (Excention ee) 革 创建 应 答 元 组 


System.out .println{("caught error: " + 已) ; 
了 
了 
} 


该 方法 的 主体 是 一 个 while (true) {...} 无 穷 循环 ,消息 处 理 便 在 该 循环 内 完成 。 这 里 的 错 
误 处 理 逻 辑 非常 简单 ， 期 间 出 现任 何 错误 ， 只 会 误 信 息 ， 然 后 便 继续 执行 。 收 到 的 消 县 应 该 
是 个 二 元 组 , 其 中 包含 发 送 方 的 pid 和 一 个 姓名 字符 串 。 接 下 来 的 代码 负责 分 解 该 元 组 并 构造 出 应 
答 字 符 串 ， 然 后 将 之 与 信箱 pid 一 起 放 入 应答 元 组 园 。 这 些 操作 在 上 一 节 中 我 们 都 介绍 过 

成 功 编译 JInterfaceExample.java 后 ， 下 面 我 们 就 来 运行 这 个 示例 。 


13.1.5 ”在 Erlang 中 与 Java 节 点 通信 


如 8.2.3 节 所 述 ，Erlang 节 点 需要 依靠 EMPD 和 守护 进程 来 定位 其 他 节点 。 基 于 Jinterface 库 的 节 
点 也 不 例外 , 但 Jinterface 自 号 无 法 启动 EPMD。 不 过 Erlang 广 点 启动 时 会 对 本 地 的 EPMD 进 程 进行 
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检查 。 如 采 EPMD 进 程 不 存在 ，Erlang 广 点 会 日 动 启 动 EPMD。 这 样 一 来 问题 就 简单 了 : 局 动 
Jinterface 代 人 码 之 前 和 完 局 动 一 个 Erlang 广 点 就 万 事 大 吉 了。( 局 动 之 后 这 个 Erlang 方 点 就 没 用 了 ， 即 
便 该 节点 退出 ，EPMD 也 会 继续 运行 下 去 ， 直 至 进程 终止 或 系统 重启 。) 

首先 以 secret 为 cookie， 用 -sname 方 式 局 动 一 个 Erlang 闻 点 : 


$ erl -sname erlangNode -setcookie secret 





Eshell V5.7.4 (abort with 人 ^G) 
(erlangNode@frodo)1> 


接 下 来 ,在 新 的 终端 窗口 中 启动 Java 方 点 。 搞定 了 这 一 环 ， 在 Simple Cache 应 用 中 集成 HBase 
Java API 的 大 业 便 迈 出 了 坚实 的 第 一 步 。 
启动 Java 节 点 的 命令 行 如 下 〈 同 处 一 行 )， 请 依据 实际 情况 酌情 修改 .jar 文 件 的 路 径 


Java -cp .:/path/to/OtpErlang.jar JIinterfaceExample javaNode 
theMailbox secret 


和 javac 一 样 ， 此 处 也 需要 用 -cp 参数 指定 .class 文 件 的 搜索 路 径 。( 请 注意 ， 当 前 目录 “.” 
也 要 右 括 在 内 ， 这 样 java 才 能 找到 JInterfaceExample.class。) 接着 ，java 会 调用 包含 main () 方 法 
的 类 ， 此 处 即 JInNterfaceExample。 其 余 参 数 将 传 给 main ()， 它 们 分 别 是 Java 衣 点 的 方 点 名 、 
信箱 名 和 cookie。 

Java 程 序 启 动 后 ， 两 个 方 点 便 会 相互 搜寻 并 和 耻 接 通过 Erlang 分 布 式 协议 展开 通信 ， 如 图 13-3 
is 














操作 系统 


Java VM 








图 13-3 ”运行 在 同一 台 机 需 上 的 Java 节 点 和 Erlang 节 点 ， 二 者 通过 同一 个 EPMD 进 程 搜 
寻 到 对 方 ， 并 通过 Erlang 分 布 式 协议 展开 通信 


现在 返回 上 一 个 终端 窗口 中 的 Erlang 方 点 操练 一 番 : 


(erlangNode@frodo}1> net adm:pPing (JjJavaNode@frodo). 
pong 

(erlangNode@frodo}2> {theMailbox, javaNode@frodo} ! {selfl(), "Eric"}. 
{<0.39.0>, "Eric"} 

(erlangNode@frodo} 3> receive {Mbox, Msg} -> Msg end . 
"Greetings from Java, Ericl'" 

(erlangNode@frodo) 4> Mbox. 

<5569.1.0> 

(erlangNode@frodo}5> Mbox I! {self(}, "Martin"}. 
{<0.39.0>, "Martin"} 

(erlangNode@frodo}6> receive Tuple -> Tuple end. 
{<5569.1.0>, "Greetings from Java, Martin!'"} 
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在 Erlang 节 点 看 来 , JavaT 点 和 其 他 Erlang 世 点 一 般 无 二 ,基于 普通 消息 传递 的 通信 十 分 顺畅 。 
请 注意 , 在 不 清楚 信箱 的 唯一 标识 符 ( 参见 8.2.5 节 ) 的 情况 下 , 应 采用 {Name, Node} ! Message 
格式 的 命令 回信 箱 发 送 消息 。 等 收 到 Java 代 码 发 回 的 应 答 后 ， 就 可 直接 采用 应 答 中 的 标识 符 来 发 
送 后 续 的 消 且 本 。 

现在 ， 你 已 经 掌握 了 让 Erlang 与 Java 节 点 通信 的 方法 ， 可 以 开始 开发 Simple Cache 与 HBase 之 
间 的 接口 了 。 我 们 先 来 安装 HBase， 并 将 它 配置 成 缓存 的 后 备 存储 。 























13.2 ”安装 和 配置 HBase 


正式 开始 接口 开发 之 前 , 不 妨 先 配置 好 HBase, 以 方便 后 续 的 测试 。 这 一 节 将 简单 介绍 HBase 
的 安 妆 和 配置 。 我 们 的 主要 任务 是 配置 用 于 存储 缓存 数据 的 表 ， 但 首要 任务 是 安 钱 。 


13.2.1 下 载 和 安装 


首先 从 http:/hadoop.apache.org/hbase/ 下 载 HBase 的 tarball 文 件 (参见 10.3.1 节 ) 并 解压 到 合适 
的 位 置 。 其 次 ， 为 了 编译 本 草 的 代码， 还 需要 从 http://hadoop.apache.org/common/ 下 载 Hadoop 
Common。 编 译 代 码 时 ，javac 的 class path 中 必须 同时 包含 这 两 个 包 中 的 hbase-<version>.jar 和 
hadoop-<verslon>-core.]ar。 

HBase 有 个 不 太 寻 党 的 要 求 : 系统 中 必须 装 有 SSH 服 务 磊 ( sshd ),。 不 少 Linux 果 面 系统 在 默认 
情况 下 并 不 囊 sshd， 必须 手 动 安装 ( 最 好 借助 系统 目 刘 的 标准 软件 包 管 理 带 来 安 痛 ),。 在 Windows 
系统 下 ， 可 以 用 Windows 版 的 OpenSSH; 倘 厅 用 Cygwin 的 话 ， 不 妨 配 置 一 下 sshd 服 务 。 

下 载 HBase 的 tarball 文 件 后 ， 使 用 以 下 命令 解压 : 


$s tar -xzf hbase-0.20.3.tar.gz 


解压 后 ， 便 可 就 地 局 动 HBase 了 。 进 入 解压 HBase 的 目录 ， 并 执行 启动 脚本 


S cd hpase-0.20.3 
$s ./bin/start-hbase.sh 


这 时 » HBase 会 通过 SSH 连 接 本 地 系统 以 收集 所 需 的 信息 O 期 间 会 多 次 回 你 询 问 密码 。 





i 


注意 口 吕 HBasel] D0 000 Javacouldnotbefoundf 0 0 000Dconf/hbase-env.sh]| 0 OO 
UU export JAVA HOME[| [DD JDKI UD 


司 动 脚本 执行 完毕 后 ， 就 可 以 开始 进一步 的 配置 了 。 





13.2.2 ”配置 HBase 


就 当前 的 需求 而 言 ， 配 置 工 作 比 较 简 单 。 只 需 启 动 HBase 的 shell， 创 建 一 张 用 于 存储 绥 存 数 
据 的 表 就 可 以 了 。 请 用 以 下 命令 启 动 shell ( 请 注意 hbase 和 shel11 之 间 的 空格 ): 





图 灵 社 区 会 员 for(;;)(13433955876@163.com) 专 享 尊重 版 权 


13.3 为 Simple Cache 和 HBase 罕 线 搭桥 297 


$s ./bin/hbase shell 

稍 等 几 秒 钟 ， 紧 跟 在 HBase 当 前 版 本 相关 信息 之 后 的 便 是 HBase 的 shell 提 示 答 。 既 然 是 用 于 
存储 绥 存 数据 , 那么 表 中 保存 的 就 应 该 是 从 唯一 标识 符 到 二 进 制 数据 块 的 映射 表 。 建立 这 样 一 张 
表 的 HBase 命 令 如 下 : 


HBase (main):001:0> create 'cache’', {NAME => 'value'} 
0 row(ls) in 2.3180 seconds 
HRase (main}:002:0> exit 


这 样 便 建 好 了 一 张 名 为 cache 的 表 (这 是 一 张 映 射 表 ， 详 情 请 参见 HBase 文 档 。)， 表 中 仅 含 一 
个 字段 ， 名 为 value。 和 大 多 数 关 系 型 数据 库 不 同 ， 在 HBase 中 一 切 都 是 二 进 制 数据 ， 因 此 无 须 
指定 字段 类 型 。 

还 挺 简单 的 ， 是 吧 ? HBase 配 置 完毕 ， 现 在 正式 开始 开发 接口 ， 为 了 能 在 Simple Cache 中 访 
问 HBase 而 香 斗 吧 ! 


























13.3 为 Simple Cache 和 HBase 牵线 搭桥 


在 本 章 中 ， 我 们 将 搭建 一 套用 于 桥接 Erlang 与 HBase 的 接口 ， 这 大 接口 是 按 绥 存 应 用 的 后 妆 
存储 需求 量 身 定制 的 一 一 我 们 并 不 打算 写 一 套 通用 的 HBase 绑 定 。 明 确定 位 之 后 ， 工 作 量 也 随 之 
又 减 。 东 西昌 小 ， 这 一 方案 的 结构 还 是 十 分 清晰 的 ; 为 了 证 任务 更 罕有 挑战 性 ,我 们 还 用 上 了 线 
程 池 ， 以 便 能 够 以 异步 方式 处 理 请 求 。 

这 套 接口 分 为 4 个 主要 部 件 ， 如 图 13-4 所 示 。 




















Erlang 方 面 


z Java 方 面 





Erlang API 
国 数 
(Sc_ hbase) 


Java 节 点 请 求 处 理 
(HBaseNode) |(HBaseTask) 


数据 库 抽象 层 


(HBaseConnector) 


图 13-4 ”Erlang-HBase 桥 接 接 口 由 1 个 Erlang 模 块 和 3 个 Java 类 组 成 ， 界 限 清楚 、 职 区 明晰 





口 Erlang 代 码 一 一 即 se hbase 模 块 ， 内 仿 put 、get 、delete 等 API。 和 其 他 gen server 实 现 
模块 提供 的 API 一 样 ， 这 些 旺 数 负 责 封 攻 简单 消息 协议 。 
通过 直接 调用 HBase Java API 来 实现 上 述 操作 ， 隐 藏 相关 的 








口 Java 类 HBaseConnector 
实现 细节 。 

口 主 Java 类 HBaseNode 用 于 表示 JavaT 点 。 该 类 与 13.1.4 节 的 示例 代码 类 做 ， 负 责 处 理 
和 派发 来 日 Erlang 的 请 求 。 
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口 Java 类 HBaseTask 人 负责 在 各 目的 线程 中 处 理 请求 ,通过 调用 HBaseConnector 执 行 相 
关 功 能 后 ， 将 应 答 回 传 给 Erlang 客 户 端 。 
本 方 镜 余 内 容 会 依次 介绍 这 4 个 部 件 的 实现 。 其 中 最 简单 的 当 属 Erlang 模 块 sc_hbase， 不妨 先 
拿 它 开刀 。 该 模块 定义 了 了 Erlang 与 Java 辐 的 通信 协议 。 














13.3.1 ”Erlang 方面 : sc_hbase.erl 


本 章 所 和 欲 达 成 的 目标 我 们 已 在 图 13-1 中 展示 过 了 。Simple Cache 中 的 搬入、 查找 、 删 除 等 主 
要 数据 库 操作 ， 都 必须 反映 到 HBase 上 。 

按照 这 个 方 回 ， 我 们 先 在 simple_ cache 应 用 中 新 建 一 个 模块 sc hbase 用 作 Erlang HBase API， 
该 模块 将 对 外 提供 put 、get、qelete3 个 API 困 数 。 在 我 们 制定 的 协 以 中 ， 发 送 至 JavaT 点 的 消 
息 都 以 元 组 为 基本 格式 ， 元 组 中 的 元 素 包 括 请 求 标 签 (put 、get 或 aelete )、 发 送 方 的 pid、 对 
请 求 的 唯一 标识 符 的 引用 、 竺 查 的 键 ， 及 对 应 的 值 (可 选 ， 仅 用 于 put )。 这 套 协 议 简 清明 了 ， 
用 Java 处 理 起 来 也 十 分 方便 。 

这 些 API 逊 数 的 第 一 个 参数 都 是 Java 市 点 的 市 点 名 ,同时 还 假定 Java 广 点 的 信箱 的 注册 名 回 
定 为 hbase_server。( 与 HBase 对 接 的 Java 节 点 可 以 有 多 个 ， 只 要 市 点 名 不 重复 就 行 ; 信箱 名 作 
为 公开 的 入 口 位 置 ， 便 编码 到 协议 中 也 没有 什么 不 妥 。) 由 此 ， 不 难 写 出 sc_hbase:put/3 的 
实现 : 


DuUL (Noade，Kesy，Valuej) 一 > 
Ret = make Te ) ， 























{hbase_server, Node} ! {put, self{}, Ref, term to_ binary (Key), | 
term to_ binary (Value})}, 
receive 将 键 、 值 转换 
{reply, Ref, ok} -> 为 二 进 制 串 
ok 


after 3000 -> 
{error, timeout} 
end. 


此 处 之 所 以 用 make_ref () 为 每 个 请 求 创建 引用 ， 是 为 了 能 在 receive 表 达 式 中 过 滤 出 与 特 
定 请 求 相 对 应 的 应 答 ， 以 免 被 无关 消息 “迷惑 ”"。 此 外 ， 在 Erlang 代 码 中 ， 键 和 值 都 被 
term_to_binary/1 转 换 成 了 二 进 制 串 ; 消息 元 组 中 各 元 系数 据 类 型 的 确定 和 统一 , 可 以 有 效 简 
化 Java 代 码 中 的 消息 解析 逻辑 。( 在 HBase 看 来 , 无 论 键 还 是 数据 都 只 是 字 市 序列 而 已 。) 如 果 Java 
方 点 一 甫 没有 给 出 应 答 ， 最 终 将 触发 超时 。 

get 羡 数 则 更 为 简单 。 它 的 职责 是 从 Java 节 点 给 出 的 应 答 中 识别 出 二 进 制 串 格式 的 值 ， 然 后 
再 将 它 转换 成 Erlang 项 式 0 如 果 应 答 中 的 值 并 非 二 进 制 串 而 是 原子 not_found 、 则 get 返 加 


{error,not found】 : 



































get (Node, Key) -> 
Ref = make reft{), 
{hbase_server, Node} !' {get, self(}, Ref, term to binary (Key)}., 
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receive 
{reply, Ref, not_found} -> 
{error, not found}: 
{reply, Ref, Binary} -> 


{ok, binary to term(Binary)} 将 二 进 制 串 转换 为 

after 3000 一 > 
项 式 

{error, timeout)} 

end. 
最 后 是 delete， 该 函数 与 get 类 似 , 但 只 会 返回 ok”: 
delete{Node, Key) 一 > 
Ref = make ref(}), 
{hbase server, NodGe} |! {delete, self(}, Ref, term to binary (Key) }, 
recelive 
{reply, Ref, ok} 一 > 
Ok 


after 3000 -> 
{error, timeout} 
end. 


就 这 么 多 了 。( 别 忘 了 在 simple_cache.app 文 件 的 模块 列表 中 加 入 se_hbase。) 上 述 代 人 码 中 最 关 
键 的 便 是 由 各 API 函 数 定 义 的 协议 ， 也 就 是 请 求 元 组 和 应 答 元 组 的 具体 格式 。 

现在 转 过 头 来 看 看 HBase 桥 接 接口 中 的 Java 人 代码， 相对 而 言 这 部 分 要 更 为 复杂 。 首 先是 
HBaseConnector 类 ， 它 封 冯 了 HBase 系 统 的 核心 交互 逻辑 。 











13.3.2 HBaseConnector 类 


完成 了 Erlang API, 该 来 实现 对 应 的 Java 困 数 了 一 一 也 就 是 图 13-4 中 最 右 侧 的 各 个 部 件 , 完成 

这 些 部 件 之 后 ， 集 中 精力 将 两 端 调 通 便 万 事 大 吉 了 。HBase Java API 是 一 套 较 为 重型 的 通用 数据 
i 不 过 我 们 只 需 用 它 实 现 上 一 节 定 义 的 put、get 、delete3 个 操作 就 可 以 了 。 这 些 操作 将 
由 HBaseConnector 类 封装 。 这 样 一 来 ， 其 余 代码 就 不 用 直接 跟 HBase 打 交道 了 。 








Java 代码 和 C 代码 该 放 在 哪儿 

为 了 将 应 用 中 的 Java 代码 和 Erlang 代码 隔离 开 来 ， 通 常 不 把 .java 文件 放 在 src 目录 下 ， 
而 是 将 之 放 在 另外 的 java src 目录 下 。 (C 代码 则 放 在 c_ src 下 。)C 和 Java 源 码 编译 后 的 产 
物 (DLL、 可 执行 文件 、.class 文件 、.jar 文 件 等 ) 则 应 放 到 priv 目录 下 ， 这 样 在 交付 发 布 镜像 
时 就 无 须 将 源码 文件 圳 插 在 内 了 。 


新 建 simple cache/java_src 目 录 ， 并 在 目录 下 创建 HBaseConnectorjava。 由 于 需要 访问 HBase 
Java API， 必 须 在 源码 文件 中 导入 相关 的 库 。 编译 、 运 行 Java 代 码 时 ,不 要 忘记 在 -cp 参数 后 给 出 
hbase-<version>.jar 文 件 ( 位 于 解压 后 的 HBase 目 录 下 ) 和 hadoop-<version>.jar 文 件 (位 于 解压 后 
的 Hadoop Common 目 录 下 ) 的 具体 位 置 。 源 文件 的 开头 如 下 : 





OQ 除非 Java 节 点 述 迟 不 返回 应 答 从 而 触发 超时 。 一 一 译 者 注 
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import org.apache.hadoop.hbase.HBaseConfiguration; 
impPort org.apache.hadoop.hbase.client.*; 
import java.util.NavigableMap; 


紧 接 着 是 HBaseConnector 类 及 其 构造 隐 数 的 定义 : 


Public class HBaseConnector { 
private HTable table; 


Public HBaseConnector(}) throws Exception f 
Se 
table = new HTable(new HBaseConfiguration(}, "cache"}).; < 一 


} 
传 入 配置 对 象 


// the rest of the code goes here 
} 


简单 起 见 ， 本 草 中 的 Java 类 不 属于 任何 Java 包 。 编 译 时 将 .class 文 件 与 源 文件 一 起 直接 放 在 
java _ src 目录 下 即 可 。 

HBaseConnector 类 只 有 一 个 成 员 变 量 ， 这 便 是 用 于 访问 HBase 表 的 HTable 对 和 象 ( 由 HBase 
Java API 定 义 )。HTable 类 的 构造 图 数 以 HBaseconfiguration 对 象 为 参数 ， 具 有 良好 的 可 定制 
性 。 根据 我 们 当前 的 需求 , 默认 配置 即 可 满足 需求 ,因此 只 和 需 问 构造 函数 中 传 入 一 个 全 新 的 配置 
对 象 ， 再 附 上 打算 访问 的 数据 库 表 (〈 即 在 13.2.2 节 创建 的 cache 表 ) 的 表 名 就 可 以 了 。 

完成 初始 化 之 后 ， 就 轮 到 get 、put 和 aelete 方 法 了 。 如 前 文 所 述 ， 键 与 二 进 制 值 之 间 的 映 
射 关 系 就 存在 先前 建立 的 HBase 表 中 。 首 先是 负责 从 数据 库 中 读 取 所 需 值 的 get 方 法 : 


Public byte[] get {byte[] key) throws Exception { 
// Throws NullPointerException if key is not found 
Result result = table.get new Get (key})}); 
NavigableMap<lbyte[], NavigableMap<bytel[], bytel]>> map = 
result.getNoVersionMap(}); 























return map.get ("value'".getBytes{(}}) .get{"".getBytes!{()}).; 
} 


先 构造 一 个 cet 对 象 来 描述 欲 获 取 的 数据 条 目 ， 再 以 它 为 参数 调用 table 对 象 的 get 方 法 ， 
这 便 是 调用 HBase API 从 表 中 读 出 所 需 的 值 的 全 过 程 。 值 得 注意 的 是 , 无 论 是 get 方 法 的 key 参 数 ， 
还 是 通过 其 他 方法 传 给 HBase 的 其 他 参数 ， 全 都 是 字 节 数组。 在 HBase 中 ， 一 切 数据 都 是 字 节 序 
列 ， 没 有 类 型 之 分 。 在 与 HBase 交 互 时 ， 一 切 数据 都 得 转换 成 字 节 数组 ， 这 也 是 我 们 需要 在 API 
之 外 再 做 一 层 包装 的 原因 之 一 。 

get 方 法 会 返回 一 个 Result 对 象 ,借助 它 便 可 以 访问 从 数据 库 中 读 取 到 的 值 . 为 了 访问 数据 ， 
我 们 必须 先 创建 一 个 用 于 描述 HBase 中 的 数据 的 NavijgableMap 对 象 ， 再 将 结果 读 人 这 个 映射 。 
听 起 来 有 点 儿 绕 : 首先 用 ( 字 节 数组 形式 的 ) 字段 名 调用 NavigableMap 对 象 的 get 方 法 ， 该 方 
法 将 返回 为 一 个 NavigableMap 对 象 ， 其 中 包含 按 域 区 分 的 多 个 不 同 的 值 。 后 续 我 们 将 会 提 到 ， 
在 向 HBase 写 人 数据 时 ， 我 们 指定 的 域 为 空 。 因 此 ， 读 取 数 据 时 照 葫芦 画 球 ， 以 空 字 节 数组 为 参 
数 调 用 第 二 个 NavigableMap 对 和 象 的 get 方 法 ， 即 可 获得 与 给 定 的 键 相 对 应 的 值 。 

put 方 法 更 为 简 单 ， 跟 get 差 不 多 ， 只 是 方 同 相反 : 


























图 灵 社 区 会 员 for(;)(13433955876@163.com) 专 享 尊重 版 权 


13.3 为 Simple Cache 和 HBase 罕 线 搭桥 301 


Public void put (byte[] key, bytel[l] value) throws Exception { 
Put Put = new Put (key); 
put.add{('"'value'".getBytes(), "".getBytes(), value).; 
table.put (put}): 

} 


首先 用 给 定 的 键 创建 一 个 Put 对 象 。 接 着 ， 以 value 为 字段 名 、 以 空 串 为 域 ,为 Put 对 和 象 补 
上 与 刍 相 对 应 的 值 ( 其 中 字段 名 和 域 都 是 学 市 数组 ), 然后 , 调用 table 对 象 的 put 方 法 将 数据 写 
人 HBase。 

3 个 API 中 ， 最 简单 的 便 是 delete 方 法 : 


PUublic void delete(byte[] key) throws Exception { 
Deljete del = new Delete (key}).; 
table.deletel!del}).， 

} 


首先 用 待 删 除 的 键 创建 一 个 Del ete 对 和 象 ， 然 后 用 它 调 用 tapl e 对 和 象 的 delete 方 法 即 可 。 
现在 你 已 经 掌握 了 执行 基本 数据 库 操 作 的 方法 ,该 轮 到 Java 广 点 的 核心 部 件 了 : 那 就 是 负责 
将 Java 和 Erlang 对 接 到 一 起 的 HBaseNode 类 (参见 图 13-4 )。 








13.3.3 ”Java 中 的 消息 处 理 


Java 方 点 的 主要 框架 与 13.1.4 节 中 的 通信 示例 差不多 。 具 体 来 说 , 它 负 责 接收 发 自 Erlang 的 请 
求 消息 ,对 请 求 进行 分 析 和 拆 解 之 后 再 分 别 进行 处 理 。 更 有 意思 的 是 ,我们 还 用 上 了 异步 处 理 机 
制 ， 每 条 消息 都 会 由 单独 的 Java 线 程 负责 处 理 ， 而 不 会 简 简单 单 地 一 次 只 处 理 一 个 请 求 。Java 的 
并 发 处 理 能 力 远 不 如 Erlang， 给 每 个 请 求 单 开 一 个 线程 的 话 ， 效 率 太 低 。 因 此 ， 我 们 求助 于 Java 
标准 库 提 供 的 线程 池 。 好 在 标准 库 为 我 们 化 解 了 大 部 分 多 线程 相关 的 复杂 性 。 























通信 瓶颈 
在 当前 的 系统 设计 下 ， 有 一 点 需要 格外 注意 。 虽 然 用 上 了 线程 池 (参见 代码 清单 13-2 ) ， 
但 OtpMBox 对 象 仍然 只 有 一 个 ， 而 它 将 会 成 为 请 求 处 理 的 瓶颈 。 当 前 这 个 应 用 倒 还 好 ; 要 求 


更 为 严格 的 应 用 则 可 能 无 法 容 念 这 个 瓶颈 。 在 解决 这 类 问题 时 ，Erlang 中 的 很 多 方法 也 同样 适 
用 于 Java 场景 下 。 


和 示例 代码 中 一 样 ， 我们 需要 一 个 类 来 表示 市 点 的 主 入 口 。 这 个 类 人 负 贡 初始 化 Java 方 点 和 用 
于 接收 外 来 请 求 的 信箱 。 接 着 ,市 点 进入 循环 ,不断 读 取 信箱 中 的 消息 。 每 处 理 一 条 消息 ， 就 构 
造 一 个 任务 对 象 并 将 之 推 和 队列， 由 这 个 对 象 负 贡 在 男 外 的 线程 中 处理 请 求 并 执行 数据 库 操作 。 
请 求 处 理 完毕 后 ， 该 对 和 象 会 回 请 求 的 发 起 方 回 传 一 个 应 答 。 全 过 程 中 的 数据 流程 和 控制 流程 如 
图 13-5 所 示 。 
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Java 线 程 池 





请 求 
ae 


图 13-5 在 Java 线 程 池 的 线程 中 处 理 请 求 。 这 样 可 以 同时 处 理 多 个 请 求 ， 增 加 系统 的 
否 吐 能 
Java 闻 点 的 主 入 口 是 HBaseNode 类 (位 于 新 建 的 源 文件 java_src/HBaseNode.java 内 )。 代 码 清 
单 13-2 展 示 的 便 是 这 个 类 的 定义 、 构 造 国 数 ， 还 有 main 方 法 。 不 妨 和 13.1.4 节 中 的 
JInterfaceExample 类 做 个 比较 。 本 例 中 的 信箱 名 是 固定 的 ， 因 此 构造 函数 只 有 两 个 参数 。 


代码 清单 13-2 HBaseNode 类 


impPort com.ericsson.otp.erlang.*. 
import Java.util.concurrent.*.， 











public class HBaseNode { eg 


private HBaseConnector conn; 
private ExecutorService exec; 
private OtpNode node; 
private OtpMbox mbox; 


Public HBaseNode (String nodeName, String cookie) 
throws Exception { 


super () ; 9 创建 HBaseConnector 实 例 
Conn = new HBaseConnector!(): 

EXEC = Executors.newFixedThreadPool {10}: 

node = new OtpNode (nodeName, cookie); 8 创建 Java 线 程 池 





mbox = node.createMbox ("hbase server'"}.: 


Public static void main(String[] args) throws Exception { 

if (args.length I= 2) { 
System.out .printilin('"wrong number of arguments"); 
System.out.println("expected: nodeName cookie"}.: 
return: 

} 

HBaseNode main = new HBaseNode{(args[0].,args[1])}):; 

main.process ().;: 


} 


// the rest of the code goes here 
} 


除 丁 可 TITnterfaceExample 构 造 旺 数 中 的 铺垫 工作 以 儿 卜 ， 此 处 还 新 建 了 一 个 用 于 连接 本 地 HBase 
服务 器 的 HBaseconnector 对 象 侈 ， 以 及 一 个 用 于 派发 请 求 的 线程 池 合 。 ( ExecutorService 
类 由 Java 标 准 库 提供 。 使 用 它 之 前 必须 先导 入 java.util.concurrent 包 中 的 相关 定义 @, ) 
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a ) 方 法 , 和 JInterfaceExample 类 中 的 基本 上 一 模 一 样 , 只 不 过 不 再 需要 通过 
命令 行 参 交 箱 名 。 Ms 程序 的 主 循环 也 位 于 process 方 法 中 ， 如 代码 清单 13-3 所 
不 。 无 穷 循 环 一 直 等 待 着 外 来 消息 ， 跟 Erlang/OTP gen server 差 不 多 。 新 消息 到 来 后 会 被 从 
as ， 然后 小 发 至 新 的 HBaseTask 对 象 以 符 处 理 。( 请 注意 这 上 段 代 人 码 并 不 负 
责问 调用 方 发 送 应 答 。) 








代码 清单 13-3 HBaseNode.process () 





























// message format: { Action, FromPID, UnigueRef, Key [，Value] } 
Private void process() ff 
while (true) { 
try 1 sj 

OtpErlangObject mseg = mbox.receive{(): 分 解 消息 
OtpErlangTuplje t = (OtpErlangTuple) msg; 
String action = (foOtDpErlandatom t.elementAt (0})} .atomValue{), 
OtpErlangPid from = {OtpErlangPid}) t.elementAt (1).,; 
OtpErlangRef ref = (OtpErlangRef) t.elementAt (2);: 
bytel[l] key = ((OtpErlangBinary) t.elementAt (3)) .binaryVvalue!(}).; 





byte[l] value; 


| ‘ 
HBaseTask task = null; 创建 HBaseTask 对 象 











If (t.arity{}) == 5 && action.egquals ("put"})}) 1 

value = ({({OtpErlangBinary) t.elementAt (4)) .binaryVvalue!().; 

task = new HBaseTask (mbox, conn, from, ref, action, key, value).; 
} else if (t.arity() == 4 && action.eguals{("'put"}) { 

task = new HBaseTask (mbox, conn, from, ref, action, key, null): 
} else if {(t.arity() == 4 && action.egquals ("delete")) { 

task = new HBaseTask (mbox, conn, from, ref, action, key, null); 
} else { 

System.out.println{({"invalid reguest: " 二 七); 

continue: 
} 
exec. submit (task}): 

人 6#* 征 H8BaseTask 提 交 至 线程 池 


System.out .println("caught error: " + e); 


} 


} 

如 末 发 现 消 息 格 式 错 误 ， 则 回 标 准 输出 打印 错误 信息 。( 请 求 元 组 的 格式 不 正确 的 话 ， 就 没 
法 确定 发 送 方 是 谁 ， 自 然 也 就 无 法 发 送 应 答 。) 对 于 需要 达到 线 上 产品 质量 的 代码 ， 则 应 该 采用 
log4j 等 日 志 服 务 ; 就 本 例 而 言 ， 打 印 到 标准 输出 就 够 了 。 

和 JInterfaceExample 一 样 ， 首 先 对 消息 进行 分 解 估 ， 提 取出 消息 中 的 元 素 并 转换 成 恰当 
的 类 型 。 过 程 中 如 末 发 生 错 误 , 抛 出 的 异 稼 将 被 捕获 并 打印 出 来 , 代码 则 继续 循环 处 理 队 列 中 的 

下 一 条 消息 。 

收 到 的 请 求 元 组 必定 有 4 或 5 个 元 素 。get 或 delete 消 息 只 有 4 个 元 素 , 但 put 消 息 有 5 个 。 
在 为 后 者 创建 HBaseTask 对 象 时 , 需要 赋予 一 个 有 效 的 数据 字段 ; 对 于 前 者 ,将 数据 字段 设置 为 nul1 
即 可 依 。 如 果 元 组 的 元 数 既 不 是 4 也 不 是 5 ， 则 打印 一 条 错误 信息 ， 然 后 继续 处 理 下 一 条 消息 。 
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在 Java 和 Erlang 中 分 解 消息 
请 思考 一 下 Java 等 语言 中 的 消息 分 解 方式 ,再 跟 Erlang 中 的 模式 匹配 做 一 个 对 比 。 在 Java 
中 ， 分 解 这 个 小 小 的 元 组 并 决定 后 续 的 动作 足 足 花 了 10 行 代码 。 如 果 用 Erlang 实现 ， 只 需要 
这 样 : 
Case Message of 
{Action, From, Ref, Key} -> ...; 


{Action, From, Ref, Key, Value} -> ...; 
end. 


一 个 宛 长 繁琐 ， 一 个 简洁 明了 ， 高 下 立 判 。 倒 不 是 要 故意 刁难 Java， 只 是 为 了 衬托 一 下 声 
明 式 编程 的 强大 。 简 洁 的 代码 一 目 了 然 ， 因 此 bug 也 更 难 容 身 。 


最 后 , 创建 完 持 有 数据 的 HBaseTask 对 象 之 后 , 将 之 投递 到 线程 池 中 全 以 便 进行 异步 请 求 处 
理 ， 同 时 主 循环 继续 人 处理 后 续 的 消息 。HBaseTask 是 图 13-4 中 的 最 后 一 个 有 待 实现 的 组 件 , 不 过 


并 不 复杂 。 








13.3.4 HBaseTask 类 





有 意思 的 事情 都 集中 在 HBaseTask 类 中 ， 如 代码 清单 13-4 所 示 。 由 于 实现 了 Java 标 准 库 中 的 
Runnable 接 口 ， 这 个 类 以 run 方 法 为 主 和 人口。 在 本 例 中 ，run 只 负责 分 析 请 求 中 的 动作 并 将 之 派 
发 给 处 理 相 应 操作 的 方法 。( 至 此 ， 从 Erlang 方 点 处 发 来 的 请 求 元 组 中 的 各 个 字段 已 经 被 分 解 成 
了 更 易于 使 用 的 形式 。) get 、put 、delete 请 求 分 别 由 doGet 、doPut 、doDelete 方 法 处 理 。 














代码 清单 13-4 HBaseTask 类 
import com.ericsson.otp.erlang.*.; 


public class HBaseTask implements Runnable { 
private OtpMbox mbox; 
private HBaseConnector conn; 
Private OtpErlangPid from; 
Private OtpErlangRef ref; 
Private String action; 
private bytel[l] key:; 
Private byte[] value; 


Public HBaseTask (OtpMbox mbox, HBaseConnector conn, 

OtpErlangPiqd from, OtpErlangRef ref, 
String action, bytel[l] key, bytell] value) { 

SUDer(): 

this.mbox = mbox; 

this,conn = conn; 

thigs.from = from; 

this.ref = ref:; 


this.action = action; 
this.key = key; 
this.value = value; 
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public voigd run(} { 
es 

if (action.equals ("get"™)}) { 
doCet(}).; 

} else if (action.eguals ("put"}) { 
doPut (); 

} else if (action.egquals ("delete*"))} { 
doDeletert().:; 

} else 1 
System.out .printiln("invalid action: ”+ AaAcCtion}):; 


} 
} catch (Exception ee) { 
System.out.printiln(caught error: " + e@); 
} 
} 


// the rest of the code goes here 
} 


doGet 、doPut 和 doDelete 方 法 负责 执行 具体 操作 。run 方 法 将 会 捕获 这 些 方法 抛 出 的 所 有 
异常 并 在 问 Erlang 回 传 的 应 答 中 报告 错误 。 首 先 来 看 下 doGet: 


private void doGet{) throws Exception { 
OtpErlangObject result; 
Gro 1 
result = new OtpErlangBinary (conn.get (key)); 
} catch (NullPointerException e) f{ 
result = new OtpErlangAtom({ "not found"). 
) 
OtpErlangTuple reply = new OtpErlangTuple (new OtpErlangObject[] { 
new OtpErlangAtom{({'"reply'"), ref, 
result 


})}); 














mbox.send {from, reply}: 


} 

给 定 一 个 键 ， 0 读 出 对 应 的 二 进 制 串 格式 的 值 ( 如 果 找 不 到 ， 就 发 回 原子 
not_found )。 请 注意 ， 经 过 HBase API 的 抽象 ， 利 用 HBaseconnection conn 读 取 值 的 过 程 大 
大 简化 了 。 接 下 来 ， 是 doPut 方 法 : 


private void doPut{(} throws Exception { 
Conn.put (key, value}).:; 
OtpErlangTuple reply = new OtpErlangTuple(new OtpErlangObject[] { 
new OtpErlangAtom("reply")}, ref, 
new OtpErlangAtom({( "ok",) 
1 
mbox.send{from, reply};， 


} 
doPut 跟 docGet 如 出 一 略 ， 人 负责 向 HBase 中 插入 与 指定 的 键 相对 应 的 值 。 本 例 中 该 方法 仅 向 43 
Erlang 方 面 返 回 一 个 "ok"。 最 后 ，doDelete 也 差不多 : 


private void doDelete{(}) throws Exception 1 
conn.deletekey}).;: 
OtpErlangTuple reply = new OtpErlangTuple(new OtpErlangObject[] { 
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new OtpErlangAtom( "reply"), ref, 
new OtpErlangAtom( "ok’) 
}); 
mbox.send(from, reply)}): 


} 
好 了 ，yJava 这 侧 便 告 一 段落 了 。 至 此 ， 我 们 有 了 一 个 可 运行 的 JavaT 点 ， 该 节点 提供 了 一 套 
文 持 HBase 上 的 get、put 、dqelete 操 作 的 接口 。 现 在 只 剩 下 跟 Simple Cache 应 用 整合 了 。 


13.4 在 Simple Cache 中 整合 HBase 


要 想 在 Simple Cache 应 用 中 用 上 新 鲜 出 炉 的 Erlang-HBase 接 口 ， 就 必须 改写 lookup、insert 
和 delete 3 个子 数 ， 让 它们 像 本 章 开 头 处 所 描述 的 那样 与 HBase 交 互 ， 从 而 将 缓存 数据 存 入 
HBase 表 。 好 在 我 们 早先 为 缓存 应 用 写 下 的 代码 布局 合理 ， 现 在 只 需 修改 图 13-6 中 的 前 端 模块 
Simple_cache.erl] 就 可 以 了 。 除 了 在 第 7 草 中 为 了 文 持 日 志 功 能 而 添加 的 sc_event 调 用 以 外 ， 该 模 
块 目前 的 内 容 跟 代 码 清单 6-7 基 本 一 致 〈 人 参见 6.4.3 节 )。 














Simple_cache.erl se hbase.erl 


lookup () Get () 
insert{) put () 


deletet{) 








图 13-6 在 simple cache 应 用 中 集成 sc_ hbase.erl 模 块 。 为 了 与 HBase 交 互 ， 需 要 改写 
lookup、insert 和 delete 3 个 困 数 


为 了 方便 日 后 修改 ， 我 们 首先 用 HBASE_NODE 宏 来 指 代 HBase Java 节 点 的 节点 名 。 请 将 以 下 
代码 添加 到 文件 顶部 的 导出 声明 下 方 : 

ee 

(按理 说 , 我 们 应 该 将 节点 名 设计 成 simple_cache 应 用 的 一 个 配置 项 。 这 个 改动 就 留 给 你 当做 练习 
吧 。) 下 面 我 们 开始 依次 修改 各 个 API 函 数 。 除 lookup 函 数 以 外 ， 其 余 两 个 孔 数 具 需 修改 一 行 代 码 。 








13.4.1 查询 








首先 在 simple_cache:1lookup/1 加 入 HBase 查 询 逻 辑 ， 当 (日 仅 当 ) 在 本 地 节点 上 找 不 到 
待 查 的 数据 条 上 日 时 ， 尝 试 从 HBase 中 查询 数据 。 新 版 本 如 代码 清单 13-5 所 示 。 和 此 前 一 样 ， 我 们 
利用 try/catch 来 捕获 函数 执行 过 程 中 的 各 种 错误 ( 包括 fetch 和 get 调 用 的 返回 值 与 {ok,...} 
模式 不 匹配 的 情况 )， 并 对 外 返回 not_founa。 


代码 清单 13-5 ”新 版 的 simple_cache:1lookup/1 


lookup (Key) -> 
sc_event: lookup (Key), 
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try | 
Case sc store:lookup (Key} of 
{ok, Pid} -> 


{ok, Value} = sc element:fetch!{(Pid), 


{ok, Value}; ”尝试 从 HBase 中 
{error, _} -> 获取 数据 
{ok, Value} = sc hbase:get (?HBASE NODE, Key), < 一 


insert (Key, Value), 
{ok, Value} 
end 
catch 
Class: FExcCeption 一 > 
{error, not_found)} 
End. 


本 地 市 点 上 找 不 到 ， 就 到 HBase 中 去 找 。 找 到 之 后 ， 将 读 出 的 数据 条 目 就 地 插入 绥 存 ， 用 以 
加 速 后续 的 查询 速度 。 如 朵 HBase 中 也 找 不 到 ， 返 回 值 必 不 匹配 {fok,vValue} 模 式 ， 控 制 权 随即 
洲 和 try 表达 式 的 手中 。 


最 肪 烦 的 部 分 也 不 过 如 此 了 ; 相 较 之 下 ，insert 和 adqelete 国 数 的 改动 完全 是 小 菜 一 供 。 
13.4.2 插入 





simple_cache:insert/2 负 责 将 插入 绥 存 的 数据 原封 不 动 地 存 入 HBase。 新 版 本 如 下 : 


insert (Key, Value) -> 
CaSse ScC_ Store:lookup(Key) of 
{ok, Pid} -> 
sc event:replace (Key, Value)})., 
sc element:replace(Pid, Value),; 
{error, _Reason} -> 


{ok, Pid} = sc element:create(Value), 
sc_store:insertKey, Pid), 
sc event:create (Key, Value) 


end, 同时 插入 HBase 
sc hbase:pPut (?HBASE NODE, Key, Value). < 二 一 


只 此 一 行 , 在 新 值 搬入 系统 时 顺便 调用 一 下 sc_hbase:put/2 即 可 。 不 管 给 定 的 键 是 否 已 经 
存在 ，HBase 的 数据 写 入 接口 都 一 视 同仁 "， 因 此 一 行 代码 就 能 搞定 。 不过, 为 了 避免 构成 竞 态 条 
件 ， 应 该 先 写 缓存 再 写 HBase， 否 则 与 插入 操作 同时 进行 的 查询 操作 有 可 能 会 碰 到 HBase 中 有 效 
据 而 缓存 中 无 数据 的 情况 ”。 

最 后 ， 针 对 delete 搬 数 的 改动 跟 insert 相 差 无 儿 。 


13.4.3 ”删除 
从 缓存 中 删除 数据 时 ， 必 须 同 时 清理 HBase 表 。 新 版 本 的 simple_cache:delete/1 如 下 : 43 





QQ 也 就 是 说 ，HBase 的 put 接 口 具 有 和 窜 等 性 。 一 一 译 者 注 
@) 这 会 导致 1ookup/1 重 复 调 用 insert/2。 一 一 译 者 注 
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delete{Key) 一 > 
Sc_event:delete {Key), 
Case sc store: lookup (Key) of 
(ok, Pid} -> 国 先 清除 HBase 中 的 数据 


sc hbase:delete(?HPBASE NODE, Key), 





sc element:delete (P19G); 

{error, _Reason} -> | 再 清除 缓存 中 的 数据 
Ok 

end. 


请 注意 ， SC_hbase: delete/2 调 用 必须 先 于 sc_element :delete/1 调 用 ， 以/ 防 与 删除 操 
作 并 发 执行 的 查询 操作 将 本 该 删除 的 值 重新 插入 缓存 。 如 果 先 清理 绥 存 , 新 的 查询 请 求 可 能 会 在 
HBase 中 的 数据 删除 完毕 之 前 重新 将 数据 读 出 并 插入 绥 存 。 

至 此 ， 上 一 闻 中 的 3 个 Java 类 (HBaseConnector、HBaseNode 和 HBaseTask ) 应 该 也 已 经 
编译 完毕 了 吧 ， 现 在 将 各 个 环 市 串 接 起 来 跑 跑 看 吧 。 


13.5 ”运行 集成 系统 


我 们 的 缓存 系统 已 经 比较 复杂 了 ， 要 想 让 它 跑 起 来 ， 必 须 依 次 局 动 以 下 服务 。 

口 启动 HBase(〈 人 参见 13.2.1 )。 

口 启动 至 少 一 个 联络 市 点 (为 了 给 后 续 局 动 的 Java 广 点 准备 EPMD, 请 至 少 在 本 地 机 备 上 放 
二 | 例如 : erl -sname contactl1 -detached -setcookie secret, 

口 启动 HBase 桥 接 接口 节点 ， 注 意 cookie 应 与 Erlang 节 点 保持 一 至。 详情 请 见 下 文 。 

口 启动 simple cache 系 统 (人 参见 10.2.6 节 )。 例如: erl -sname mynode -pa ./ 


simple cache/ebin -pa ./ resource discovery/ebin -boot ./simple_ cache 














-Config ./sys -setcookie Secret。 
口 如 果蔬 点 相互 不 可 见 , 请 检查 各 个 市 点 是 否 都 及 用 -sname 参 数 启动 ( 此 处 假定 HBase Java 
节 氮 采用 的 也 是 短 节 点 名 一 一 人 简 而 言 之 就 是 节点 名 的 主机 部 分 不 合 “.”)， 并 确认 所 有 证 
点 的 cookie 完 全 一 致 。 
HBase JavaT 点 的 局 动 方式 与 13.1.5 节 中 的 示例 差不多 ,不 过 要 想 运 行 HBase 桥 接 接口 ， 还 得 
用 上 几 个 Java 库 。 除 了 编译 时 用 到 的 OTP Jinterface 库 、HBase 库 和 Hadoop Common 库 (参见 13.2.1 
T) 以 外 ， 还 需要 : 
口 Apache Commons Logging， 参 见 http://commons.apache.org/logging/; 
































口 log4j， 参 见 http://logging.apache.org/log4j/; 

口 Apache ZooKeeper， 参 见 http:/hadoop.apache.org/zookeeper/。 

好 在 这 些 库 的 JAR 包 在 HBase 的 lib 目 录 下 部 有 ， 为 你 人 免除 了 逐一 安装 的 抹 烦 。 

当然 ， 为 了 定位 HBase 桥 接 接口 的 .class 文 件 ， 还 得 在 Java 的 class path 中 加 上 simple cache/ 
java_src 目 录 ; 如 末 选 择 将 生成 的 .class 文 件 与 java 源 但 文件 隔离 开 来 , 那么 就 应 该 是 simple_cache/ 
privjava 目 录 。 局 动 JavafT 点 的 命令 很 楷 琐 ， 大 概 是 这 样 〈 以 下 内 容 全 部 位 于 同一 行 ， 只 因 依 幅 
所 限 才 做 了 折 行 处 理 ): 
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Java -cp SImple_cache/]java_ src:/Path/to/OLPEr1ancd.]Jar:/Patnhy/to/ 
hbase-<version>.Jar:/path/to/hadoop-<version>-core.Jar: /path/to/ 
Commons-logging-<version>.jar:/path/to/l1o0g4jJj-<version>.jJar:/path/to/ 
ZOookeeper-<version>.jJar HBaseNode hbase secret 


其 中 hbase 是 节点 名 ， 应 与 simple _ cache.erl 中 定义 的 HBASE_NODE 宏 保持 一 致 ( 13.4 节 ); secret 
是 Java 方 点 的 cookie 字 符 囊 。 emda i 的 cLASSPATH 环 境 变 量 来 取代 -cp 命令 行 参 
数 。 此 外 ， 还 可 以 写 个 shell 脚 本 来 执行 该 命 

一 切 顺 利 的 话 ，HBase 数 据 库 、 ean 口 节 点 、simple_cache 目 标 系统 就 悉数 启 
动 完 毕 了 。 现 在 ， 可 以 通过 simple _ cache 模块 完成 缓存 数据 的 es ， 还 能 直接 用 sc_ hbase 
模块 查看 和 操纵 HBase 中 的 内 容 ， 正 如 以 下 交互 会 话 过 程 所 示 : 


Eshell V5.7.3 (abort with ^G) 

(mynode@localhost)1> sc hbase:get hbasegdlocalhost, foo)}. 
{error,not found} 

(mynode@localhost)}2> simple cache:insert (foo, bar). 











=INFO REPORT==== 24-ApPr-2010::21]:25:27 === 
create'foo, bar) 

ok 

(mynode@localhost)})3> simple_ cache:l1oo0kup (foo)}). 
=INFO REPORT==== 24-ApPr-2010::21:25:50 === 
lookup (foo) 

{ok, bar} 

(mynode@localhost)4> sc hbase:get (hbaseQalocalhost, foo}). 
{ok, bar} 

(mynode@localhost)})5> simple_ cache: lookup(17). 
=INFO REPORT==== 24-Apr-2010::21:27:17 === 
lookup(17) 


{error,not_found)} 




















(mynode@localhost}é6é> sc hbase:put (hbasea@localhost, 17, 42}). 
ok 

(mynode@localhost)7> sc hbase:get (hbasealocalhost, 17). 
{ok, 42} 

(mynode@localhost)8> simple cache:lookup(17) 

=INFO REPORT==== 24-Apr-2010::21:29:09 === 

lookup {17) 

=INFO REPORT==== 24-Apr-2010::21:29:09 === 鸯 自动 缓存 HBase 中 的 数据 
creater1l7, 42) 

{ok, 42)} 

(mynode@localhost)}9> simple cache:lookup!(17). 向 缓存 查询 直接 命中 
=INFO REPORT==== 24-Apr-2010::21:34:49 === 

lookup {17) 

{Ok, 42} 

(mynode@localhost)}10> simple cache:delete (foo). 

=INFO REPORT==== 24-Apr-2010::21:29:41 === 

deletet{foo) 

OK 

(mynode@localhost})}11> simple cache:lookup (foo). 

=INFO REPORT==== 24-ApPr-2010;:;21:29:44 === 

lookup (foo) 


{error,not found} 
(mynode@localhost)12> sc hbase:get (hbasea@localhost, foo). 
{error,not found} 
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我 们 来 看 看 以 上 交互 过 程 中 都 发 生 了 些 人 什么。 首先 ， 我 们 查 得 HBase 中 不 存在 foo。 将 foo 
插入 绥 存 后 ， 从 缓存 和 HBase 中 都 可 以 查 得 foo。 

接着 ， 我 们 查 得 绥 存 中 没有 17。 将 17 一 42 直 接 写 人 HBase， 有 再 做 一 次 查询 ， 绥 存 会 从 HBase 
中 该 出 17 并 将 17 一 42 插 和 缓存。 在 接 下 来 的 查询 中 , 17 直 接 命 中 缓存。 最 后 , 从 缓存 中 删除 foo， 
经 验证 HBase 中 的 foo 也 被 同时 删除 。 

如 你 所 见 ， 一切 都 运转 自如 。 有 一 条 info 日 志 消 息 create (17,42) 人 @ 特 别 值 得 注意 : 缓存 
中 找 不 到 17 时 ， 回 HBase 发 起 查询 〈 必 须 事先 回 其 中 搬入 )， 并 将 读 出 的 值 日 动 存 入 绥 存 以 备 后 
用 。 下 一 次 查询 果然 直接 命中 缓存 人 四。 用 户 想必 会 欣喜 万 分 。 

















13.6 小结 


现在 你 已 经 掌握 了 利用 Jinterface 和 Java 创 建 非 Erlang 节 点 并 与 之 交互 ， 进 而 将 之 集成 到 系统 
中 去 的 方法 。 同 样 的 手段 还 可 用 于 创建 任意 Java 库 的 桥接 接口 。 

本 书 的 旅程 就 快 结 束 了 。 但 愿 你 所 习 得 的 知识 对 得 起 这 一 路 上 的 坎坷 : Erlang 语 言 ;OTP 应 
用 中 的 行为 模式 、 监 督 机 制 、 日 志 , 还 有 事件 处 理 ; 分 布 式 Erlang、Mnesia 以 及 发 布 镜 像 的 制作 ; 
通过 HTTP、 端 口 、 驱 动 以 及 Jinterface 集 成 外 围 代码 。 在 下 一 半 中 ， 我 们 将 学 习 代码 测评 和 性 能 
优化 相关 的 技术 ， 从 而 让 你 的 应 用 跑 起 来 更 加 顺畅 。 
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优化 与 性 能 


没有 绝对 的 快 ， 只 有 够 不 够 快 的 问题 ， 


Joe Armstrong 





本 章 概要 

口 如 何 进行 性 能 调 优 

口 利用 cprof 和 fprof 分 析 代码 

D Erlang 编 程 语言 的 局 限 和 陷阱 


除非 到 了 必须 为 那 几 晕 秒 、 几 千 字 节 锚 铁 必 较 的 地 步 ， 否 则 不 要 总 想 厦 去 做 优化 。 现 在 ， 
Erlware 团 队 便 已 经 “ 洛 人 ”了 这 种 境地 。 事 实 表 明 ， 很 多 人 都 希望 能 有 一 个 集中 式 的 Erlang 软 件 
下 载 站 。 经 过 速度 提升 和 功能 改善 ， 同 时 也 拜 你 开发 的 简单 缓存 服务 所 赐 ，erlware.org 的 访问 量 
日 益 增 长。 效率 问题 又 开始 西亚 。 当 前 我 们 没 法 增加 硬件 投入 ， 要 想 靠 添加 机 硕 来 实现 水 平 扩展 
那 是 不 可 能 了 。Erlware 团 队 必 须 优 化 代码 ， 尺 可 能 “榨取 ”每 一 个 时 钟 周期 。 














Martin 说 go000d 

我 还 记得 2002 年 在 美国 的 函数 式 编 程 会 议 上 藉 一 回 碰 到 Joe Armstrong 时 的 情景 。 他 是 
Erlang 的 创始 人 之 一 , 满口 金玉 良言 和 各 种 计算 机 科学 方面 的 和 能 言 人 警句 ; 这 些 话 有 些 出 自 他 本 
人 ， 有 些 则 源 自 别处 。 有 些 话 深 深 地 吸引 了 我 ， 其 中 有 一 句 我 特别 喜欢 :“ 先 跑 起 来 ， 再 去 追 
求 美 ; 最 后 ， 只 有 实在 没有 别 的 办 法 的 时 候 ， 才 去 追求 速度 。 他 接着 说 , “然而 在 90% 的 情 
况 下 ， 速 度 与 美 同 在 。 因 此 本 质 上 讲 ， 人 全心全意 地 追求 美 就 可 以 了 1” 


你 的 代码 已 经 足够 精美 了 , 我 们 只 能 从 底层 开始 优化 。 本 鞋 的 目的 便 是 向 你 介绍 一 些 人 的 用 
于 优化 先前 章节 中 编写 的 代码 工具 ， 从 而 为 Erlware 团 队 提 供 帮 助 。 在 正式 进入 这 一 章 之 前 , 我 们 
希望 你 能 明日 ， 以 简洁 、 可 谈 性 和 可 维护 性 为 代价 去 换取 性 能 并 非 上 选 ; 只 有 在 代码 已 经 打磨 得 
精美 绝伦 却 仍 然 无 法 满足 需求 时 , 方 能 出 此 下 策 。 本 鞋 介 绍 的 正 是 那些 极 少 数 无 法 通过 追求 代码 
之 闫 来 达成 日 标的 情况 。 

性 能 优化 唯一 的 秘诀 便 是 系统 化 。 有 些 问 题 非常 明显 , 一 眼 就 能 看 出 来 ; 除了 这 些 问 题 以 外 ， 


你 都 应 当先 行 度量 , 设 定 好 基准 线 并 寻找 瓶 贷 , 优化 之 后 再 次 度量 以 检验 性 能 是 个 得 到 改善 。 我 
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们 将 在 本 章 探 讨 相 关 的 工具 和 技巧 。 
首 抑 ,我 们 将 以 系统 化 的 方式 讨论 如 何 进行 性 能 调 优 ,如 何 找 出 问题 所 在 ， 以 及 如 何 确认 问 
题 修 复 与 否 。 


14.1 如 何 进 行 性 能 调 优 
从 许多 方面 来 看 ,性 能 调 优 算得 上 是 一 门 艺术 。 有 些 人 在 探寻 和 消除 瓶颈 方面 尤为 擅长 ,但 
那 多 半 出 于 多 年 经 验 结晶 而 成 的 直觉 一 -这些 东 西 是 难以 从 书 中 习 得 的 。 本 章 将 从 方法 论 的 角度 
诠释 性 能 调 优 这 门 科学 。 
Erlware 团 队 打算 按照 图 14-1 中 的 步骤 系统 化 地 进行 性 能 调 优 .我 们 来 仔细 考察 一 下 这 些 步骤。 
开始 
1. 确定 性 能 目标 

















二 水 
多 
够 好 放弃 并 添置 
新 的 硬件 


图 14-1 性 能 调 优 过 程 : 确定 目标 、 设 定 基线 、 分 析 性 能 、 优 化 、 再 度 分 析 。 循 环 
往复 直至 达成 目标 或 放弃 

14.1.1 设 定 性 能 目标 

在 开始 调 优 之 前 , 应 该 先 明 确 怎样 才 算 达标 。 目标 设 定 应 满足 以 下 几 个 特征 ( 亦 被 称 作 SMART 
原则 )。 

口 具体 ( Specific ) 一 一 表意 清晰 ， 例 如 改善 CPU 使 用 率 或 每 秒 的 行 吐 量 。 

口 可 度量 (Measurable ) 可 通过 系统 化 的 度量 进行 验证 。 

口 可 达成 〈Attainable ) 一 一 可 以 切实 达成 。 能 在 整个 项 目 力所能及 的 范围 内 实现 目标 ; 否 























则 便 是 好 高 登 远 。 
口 现实 (Realistic ) 结合 当前 的 资源 和 动因 ， 如 果 必 须 靠 整个 团队 竭尽 全 力 方 可 达成 ， 
那 多 半 不 现实 。 





口 有 时 限 (Timely ) 一 一 可 在 指定 时 限 内 完成 。 性 能 优化 不 能 没完 没 了 : 设 定时 限 有 助 于 集 
中 精力 ， 避 免 无 休止 地 纠缠 于 细 极 末节。 
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例如 ，Erlware 团 队 将 根据 erlware.org 的 网 站 点 击 量 以 及 系统 中 各 个 部 分 的 事务 量 来 确定 本 
次 性 能 优化 的 目标 。 他 们 还 打算 从 过 往 几 个 月 内 的 统计 数据 中 得 出 总 体 的 流量 增长 趋势 ， 然 后 
综合 公司 当前 的 推广 力度 ， 对 未 来 6 个 月 内 的 流量 作出 预测 。 这 些 便 是 团队 树立 性 能 调 优 目标 的 





14.1.2 ” 设 定 基线 


如 末 目 标 已 经 可 以 量化 〈 本 应 如 此 )， 便 可 以 设立 基线 了 。 按 照 先 前 立 下 的 标杆 ， 通 过 测试 
找 出 目 己 与 目标 之 间 的 差距 。 比 如 ,系统 当前 的 CPU 消 耗 和 否 吐 量 分 别 是 多 少 ( 说 的 是 调 优 之 前 
的 情况 )， 基 线 的 窗 兹 面 越 广 ， 就 越 容易 测定 代码 改动 的 影响 。 


14.1.3 ”系统 性 能 分 析 


如 条 实 测 表明 目标 尚未 达成 一 一 有 时 候 你 会 发 现 目 己 只 是 枯 人 忧 天 , 或 者 至 少 实际 问题 并 非 
之 前 想象 的 那样 ， 这 时 你 就 该 好 好 考虑 一 下 了 ， 时 间 【《〈 或 钱 、 审 宽 ) 都 花 到 哪里 去 了 ?代码 性 能 
分 析 可 以 帮 你 揪 出 很 多 问题 ， 辟 如 CPU 瓶 令 、 内 存 消耗 大 尸 、 锁 的 争 抢 热 点 ， 或 是 因 IO 而 阻塞 

















14.1.4 确定 需要 解决 的 问题 


确定 了 主要 问题 之 后 ,必须 决定 应 该 立即 着 手 解 决 的 问题 。 纵 观 全 局 , 最 重要 的 问题 有 可 能 
会 因为 成 本 过 高 ( 且 难 以 确定 收益 ) 而 不 得 不 延 后 。 有 些 问 题 则 可 能 相对 简单 ， 更 易于 解决 ， 而 
且 无 须 对 核心 组 件 大 动 干 苞 便 能 达成 当下 的 优化 目标 。 那些 收效 显 闭 , 且 能 够 在 既定 的 时 间 内 完 
成 的 问题 才 是 最 佳 选择 。 为 外 不 要 一 次 性 修复 所 有 问题 : 一 个 一 个 来 , 这样 你 才能 确认 哪些 改动 
会 对 性 能 产生 直接 的 影 啊 。 


14.1.5 测定 优化 成 果 


修改 代码 之 后 再 次 进行 测定 ， 并 将 结 来 与 之 前 设 定 的 基线 进行 比较 。 新 的 代码 是 否 有 所 改 
善 ? ( 等 你 看 到 经 过 “明显 改善 ”的 代码 被 层 层 测定 为 野 无 帮助 甚至 起 了 反作用 时 ， 可 不 要 太 过 
惊讶 。) 如 末 确 有 改善 ， 是 否 已 经 达到 先前 设 定 的 性 能 目标 ? 达到 了 的 话 ， 那 承 茶 豆 了 一 一 这 一 
轮 调 优 暂时 宣告 结束 。 人 否则 ， 折 回 图 14-1 中 的 步 又 3 并 持续 进行 性 能 分 析 、 修 改 、 测 定 ， 直 至 达 
成 目标 〈 或 者 因 时 间 消 耗 列 尽 而 不 得 不 掏腰包 更 新 便 件 ) 为 止 。 

可 用 于 系统 性 能 测定 的 工具 很 多 ， 从 简单 的 日 志 等 代码 监测 手段 ， 到 etop 、percept 以 及 开源 
的 eper 等 各 种 Erlang 专 用 工具 ， 再 到 更 外 层 的 操作 系统 级 的 专用 工具 等 ， 不 一 而 足 。 其 中 大 部 分 
都 超出 了 本 书 的 范畴 。 在 本 章 中 ， 我 们 将 为 你 介绍 Erlang/OTP 标 准 库 中 目 带 的 Erlang 代 码 性 能 分 
析 工 具 。 详 情 请 参见 下 一 他。 
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14.2 Erlang 代码 性 能 分 析 


要 想 抓 住 系 统 中 的 性 能 瓶 贷 ，, 最 可 徘 的 方法 就 是 性 能 分 析 。 实 践 多 了 ,你 就 会 练 束 一 双 火 眼 
金 睛 ， 可 以 一 眼看 出 隐藏 在 代码 中 的 性 能 问题 ; 但 性 能 瓶颈 的 定位 迟早 还 是 要 靠 性 能 分 析 。 

一 般 来 说 , 性 能 分 析 就 是 边 运行 代 人 码 边 采集 统计 数据 , 然后 将 采集 到 的 性 能 数据 与 代码 中 的 
位 置 进行 配对 的 过 程 。 最 典型 的 性 能 测试 便 是 测定 代码 中 耗 时 最 长 的 部 分 : 它们 就 是 主要 瓶颈 之 
所 在 。 测定 耗 时 的 方法 多 种 多 样 : CPU 耗 时 用 于 描述 程序 的 实际 负载 , 物理 耗 时 ( wall-clock time ) 
则 用 于 描述 程序 运行 的 总 时 长 。 物理 耗 时 长 而 CPU 耗 时 短 ， 表示 代码 大 部 分 时 间 都 处 在 等 待 状态 
(一 般 是 磁盘 或 网 络 IO )。CPU 耗 时 过 高 ， 则 表示 算法 太 烂 ( 例如 平方 复杂 度 或 指数 复杂 度 的 算 
法 )。 一 些 简单 的 性 能 分 析 需 难以 精确 记录 CPU 时 间 ， 而 用 每 个 图 数 的 调用 次 数 或 每 行 代码 的 执 
行 次 数 来 近似 表示 CPU 时 间 。 人 性 能 分 析 需 还 可 以 度量 代码 中 不 同位 置 上 的 内 存 消 耗 、LO 消 耗 、 
处 于 就 绪 状 态 的 进程 数 等 。( 程序 中 处 于 就 绪 状 态 的 进程 过 少 ， 往 往昔 味 者 页 上 了 同步 短 贷 ， 从 
而 导致 系统 并 发 度 降低 。) 

Erlang/OTP 目 市 一 系列 性 能 分 析 工 具 , 包括 用 于 检查 代码 窗 盖 率 的 cover、 用 于 分 析 内 存 使 用 
量 的 instrument 模 块 ， 以 及 最 近 出 现 的 用 于 进行 并 发 性 能 分 析 的 percept 等 工具 。 在 这 一 节 中 ， 我 
将 介绍 Erlang/OTP 中 的 两 大 时 间 分 析 工 具 : fprof 和 cprof。 首 先是 用 法 较为 简单 的 cprof。 















































14.2.1 用 cprof 计 算 调用 次 数 


cprof 工 具 输 出 的 信息 不 如 fprof 丰 富 ， 但 用 法 却 十 分 简单 。cprof 用 于 记录 函数 调用 次 数 。 相 
对 于 fprof， 它 的 主要 优势 在 于 对 运行 时 系统 的 影响 很 小 (被 分 析 的 代码 大 约会 慢 上 10% )。 因 此 ， 
如 果 要 对 线 上 运行 着 的 代码 进行 性 能 分 析 ， 使 用 cprof 更 为 合适 。 

代码 清单 14-1 中 的 示例 模块 profile ex 除了 空 跑 一 小 段 时 间 以 外 什么 也 不 干 。 这 段 代 码 的 唯一 
目的 就 是 用 做 性 能 分 析 的 对 象 。( 缓存 应 用 不 适合 拿 来 用 做 性 能 分 析 示 例 ， 它 过 于 庞大 ， 而 且 也 
不 是 CPU 密集 型 的 代码 。) 


代码 清单 14-1 用 做 性 能 分 析 对 和 象 的 示例 代码 
) 


-module (profile ex). 











竺 告 API 
-export( [run/0]}. 


run{({)} -> 
spawn (fun() -> looper{({1000)} end), 
spawn (fun{() -> funner{({1000) end}). 
looper(0) -> 
ok:; 
looper({N) -> 


= linteger_ to_list({N), 


looper(N - 1). 


funner(N)} -> 
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funner (fun(X) -> integer to 11st(X) end, N}. 


funner{_Fun, 0)} -> 
ok; 

funner (FunNn, N) -> 
FUN{N), 
funner{Fun, N - 11}. 


run() 图 数 派 生出 两 个 并 行进 程 : 第 一 个 进程 运行 1ooper/1 困 数 ， 第 二 个 进程 运行 
funner/1 捕 数 , 两 个 函数 的 参数 值 都 是 1000。looper7/1 函 数 从 1 一 直 循 环 到 输入 参数 给 定 的 值 ， 
依次 调用 integer_to_1list (N) 并 扔 掉 求 值 结果 。funner/1 气 数 的 功能 差不多 , 但 它 多 用 了 一 
个 fun 函 数 ， 并 把 它 用 做 funner/2 的 第 二 个 参数 。 

以 下 Erlang shell 会 话 演 示 了 如 何 用 cprof 来 测评 上 述 示例 模块 的 性 能 。 


Eshell V5 .7.4 (abort with ~^G) 
1> c{profile ex). 


ok .Brofile Sx} +? 启动 cprof 
2> cprof:startt). 

S359 

3> profile ex:runl!(). 

<0.43.0> 9 终止 测评 
4> cprof :pausel(). 

5380 

5> cprof:analyse (profile ex). 

[rollile ex,2006, 8& 获取 结果 


[{{profile ex,looper,l1},1001}, 
{{pPprofile ex,funner,2},1001}, 
{{Profile ex, '-funner/l1-fun-0-',1},1000}, 
{{pProfile ex,run,0},1)}, 


工 


{{Pprofile ex,module info,0},1]}, 











{{pProfile ex,funner,1},1}, 
{{PpProfile ex, '-run/0-fun--1--',0},1}, 
{{Profile ex, '-run/0-fun-0-',0},1}]} 

6> cprof:stopt). 

5380 

了 > 


编译 并 加 载 profile ex 模块 ( c(. . . ) 会 在 完成 编译 的 同时 加 载 模块 ) 后 , 调用 cprof :start ()@， 
从 此 往 后 , 所 有 模块 的 函数 调用 都 将 被 计数 。 被 测 代 人 码 本 号 无 须 做 任何 修改 一 一 无 须 特殊 的 编译 
过 程 也 无 须 重新 加 载 ,编译 代码 时 也 无 须 包 含 调试 信息 。cprof 适 用 于 任何 系统 ， 而 且 不 会 对 运行 
中 的 应 用 产生 干扰 ， 因 此 特别 有 用 。 

很 多 时 候 ， 我 们 无 须 关 注 整 个 系统 中 的 所 有 模块 ， 只 对 特定 模块 中 的 孔 数 调用 次 数 感 兴趣 。 
例如 ， 通 过 cprof:start (profile_ex) 调用 可 以 单独 测试 profile_ ex 模块 的 性 能 。 而 这 又 会 进 
一 步 降低 调用 次 数 统计 对 运行 中 的 系统 的 影响 ,不 过 ,目前 为 止 性 能 测试 带 来 的 开销 还 不 成 问题 。 

启动 cprof 并 告知 待 测 模 块 ， 然 后 启动 待 测 代 码 。 测 评 完 成 后 ， 令 cprof 暂 集 ， 停 止 对 子 数 调 
用 进行 计数 @。 只 需 调用 cprof :analyse (profile_ex) ， 便 可 获取 profile_ex 模 块 中 所 有 函数 
的 调用 次 数 。 

返回 的 项 式 很 容 多 解 谈 : 函数 按 调用 次 数 降序 排列 。 可 以 看 出 ,结果 与 预期 一 致 : 主 循环 函 
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数 looper/1 和 funner/2 各 被 调用 1001 次 。( 在 第 1001 次 调用 时 计数 需 归 零 。) 其 中 还 有 一 个 命名 古怪 
的 范 数 ， 名 为 ' -funner/1-fun-0-/1'， 调 用 次 数 刚好 是 1000 次 : 该 函数 由 编译 器 生成 ， 代 表 
funner/1 了 消 数 中 的 fun 函 数 。( 循环 计数 硕 归 零 时 该 男 数 未 被 调用 。) 其 他 上 机 数 各 被 调用 一 次 。 注 意 
到 此 处 并 未 显示 integer_to_1ist/1 调 用 。 首 先 ， 这 个 内 置 函 数 ( BIF ) 并 不 属于 profile_ex 模 
块 ， 其次， 即便 试图 单独 针对 erlang 模 块 进行 评测 ，cprof 也 无 法 记录 Erlang BIF 的 调用 次 数 。 

cprof 可 以 帮助 我 们 快速 确定 哪些 函数 被 调 用 , 以 及 各 被 调用 了 多 少 次 。 有 时 候 和 掌握 了 这 些 信 
息 就 足够 了 ,但 通常 我 们 还 需要 更 加 详细 的 信息 。 这 时 便 可 以 借助 于 fprof 工 具 。 








14.2.2 ”用 fprof 测 定 执行 时 间 


在 各 种 标准 性 能 测试 工具 之 中 ,最 有 价值 的 大 概 就 属 fprof 了 。 它 采集 的 信息 内 容 翔 实 、 格 式 
清晰 ， 而 且 十 分 易于 使 用 ， 无 疑 是 诊断 性 能 问题 的 首选 工具 。fprof 设 计 用 于 取代 旧 的 eprof (在 
Erlang/OTP 发 行 版 中 仍然 能 找到 eprof， 但 相 较 之 下 效率 却 低 得 多 )。fprof 和 eprof 痢 以 Erlang 的 跟 
踩 机 制 为 基础 ， 因 此 既 不 需要 对 代码 做 特 丈 编译， 也 不 需要 保留 调试 信息 。 它 们 的 运行 时 开销 比 
cprof 要 大 得 多 ， 会 将 代码 的 运行 速度 拖 慢 10 倍 以 上 ， 用 于 线 上 系统 时 应 格外 小 心 。 
































不 可 或 缺 的 runtime tools 应 用 

fprof 依赖 于 runtime tools 应 用 中 的 dbg (详情 参见 Erlang/OTP 文档 中 的 工具 章节 )。 使 用 
fprof 前 必须 确保 系统 中 装 有 该 应 用 。 标 准 Erlang/OTP 发 行 版 内 包含 runtime tools， 但 如 果 用 
操作 系统 自 带 的 软件 包 管 理 器 来 安装 Erlang， 那 么 最 好 检查 一 下 是 否 安装 了 这 个 包 。fprof 模 
块 ， 连 带 cprof、cover、instrument 以 及 其 他 一 些 工具 ， 都 属于 tools 应 用 。 


fprof 的 调用 方法 和 cprof 类 似 。 以 下 会 话 展示 了 如 何 用 fprof 来 分 析 上 一 节 中 的 profile_ ex 模块 : 


Eshell V5.7.4 (abort with ^ 人 G) 
1> c{profile ex). 
{ok, Profile ex} 


2> fprof:tracelistart)}). 
ok 6 开始 跟踪 


3> Profile ex:run!(). 
<O0O .42.0> 
4> fprof:trace(stop}). 


5> fprof:profilel(). 
Readling trace ale.:. 8 人 处理 跟踪 ?过程 


End of tracel! 
ok 





6> fprof:analysel{dest, "profile.txt"}). 

Processing data... 6 分 析 性 能 分 析 数 据 
Creating output... 

Done! 

ok 

了 > 
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fprof 话 没有 在 shell 中 输出 可 供 直 接 查看 的 项 式 ， 而 是 在 当前 目录 下 新 建 了 一 个 名 为 profile.txt 
的 文件 。 第 一 步 是 让 fprof 开 始 跟 踪 @。 跟踪 信息 默认 写 人 名 为 fproftrace 的 文件 , 该 文件 是 二 进 制 
格式 ,不 适合 直接 阅读 。 第 二 步 ， 像 之 前 一 样 调用 profile_ex:run() ， 稍 等 一 会 儿 ， 然 后 停止 
跟 蹊 。 接 春 ， 调 用 fprof:profile!() 全 从 而 将 跟踪 信息 转换 为 供 性 能 评测 用 的 原始 数据 。 转 换 
后 的 数据 由 fprof 服 务 器 保存 于 内 存 中 。 然 后 ， 调 用 fprof :analyse/1 全 分 析 数 据 ， 将 分 析 结 
输出 至 指定 的 文件 ( 本 例 中 是 profile.txt )。 

启动 跟 躁 并 得 到 最 终 输 出 的 方法 多 种 多 样 , 我 们 将 之 留 作 练习 ,请 人 研读 fprof 的 文档 找 出 答案 。 
待 评测 代码 的 规模 也 很 重要 。 和 cprof 不 同 , fprof 会 迅速 积 斤 数据 , 持续 对 大 段 代 码 进行 评测 的 话 ， 
fprof 会 吐出 好 儿 吉 比特 的 评测 信息 。 

能 得 出 数据 不 等 于 会 解 谈 数 据 ， 这 便 是 我 们 接 下 来 的 主题 。 

诠释 fprof 的 输出 

分 析 结 采 全 部 位 于 profile.txt 文 件 内 。 文 本 内 容 采 用 的 是 Erlang 项 式 的 格式 (以 句点 结尾 ), 时 
而 夹杂 一 些 Erlang 注 释 (以 s 开 头 )， 在 跟 Erlang 打 交道 的 过 程 中 ， 这 可 谓 是 司空 见 惯 了 。 这 样 一 
来 ， 你 便 可 以 轻而易举 地 利用 标准 库 曙 数 file:consult ( Filename ) 该 和 人 数据 并 进行 各 种 统计 。 粒 
看 上 去 ， 这 种 格式 比较 复杂 , 但 只 要 向 握 了 记 轨 ,理解 起 来 也 不 算 难 。 我 们 将 逐一 诠释 文件 中 各 
个 重要 部 分 的 含义 。 

文件 的 开头 是 注释 analysis results (分 析 结 有 末 )， 紧 跟 的 是 分 析 启 动 时 给 定 的 选项 (有 
助 于 后 续 重 跑 分 析 数 据 ): 


%% Analysis results: 





























{ analysis options, 
[{callers, true}, 
{Sort, acc}, 
{totals, false}, 
{details, true}]}. 


紧 跟着 的 一 段 包 含 函 数 的 总 调用 次 数 ( cNT 入 完整 执行 过 程 的 总 耗 时 ( Acc, 以 蝶 秒 为 单位 )， 
以 及 文件 中 列 出 的 所 有 函数 的 总 耗 时 (ON )。 


车 CNT ACC OWN 
[{ totals, D045, 78.976， e592971. 


换言之 ， 总 的 owN 耗 时 中 并 未 泣 盖 未 测评 涵 数 所 消耗 的 时 间 。 在 本 例 中 ， 我 们 并 未 将 测评 过 
程 限定 在 菏 个 特定 模块 之 内 ， 因 此 owN 和 ACC 很 接近 。 一 般 而 言 ， 固 有 时 长 ( own time ) 指 单个 
消 数 日 身 耗 费 的 时 长 , 其 中 不 包括 它 所 调用 的 其 他 函数 的 耗 时 ; 而 累计 时 长 记录 的 则 是 从 头 到 尾 
的 总 时 长 。 度 量 时 间 时 ， 默 认 采 用 的 是 物理 时 长 ， 通 过 cpu_time 选 项 可 以 对 此 进行 调整 。 

紧 跟 看 总 耗 时 信息 之 后 ， 分 段 列 出 了 跟 踩 过 程 中 所 有 Erlang 进 程 ， 每 段 的 开头 是 进程 的 摘要 
言 息 ， 如 下 所 示 : 
































和 CNT ACC OWN 
[{ "<0.51.0>", 3012,undefined., 48.973}).， 
{ Spawned by, "<0.38.0>™}, 
{ spawned as, {erlang,apply, ["#Fun<profile ex.1.108254554>",[]]1}}, 


{ initial calls, [i{erlang,apply,2}, {profile ex, '—-run/0-fun--1-',0}]}]. 
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从 initial calls 和 spawneqd_as 项 可 以 看 出 ， 这 是 由 profile_ex: run() 派生 的 两 个 进 
程 之 一 的 性 能 测试 数据 摘要 。 可 以 看 到 这 个 进程 的 owN 时 长 占 整个 文件 的 owN 时 长 的 一 半 还 多 ， 
这 个 数据 是 解释 得 通 的 : 虽然 profile_ex:run() 启动 的 两 个 进程 干 的 事情 都 差不多 , 但 在 执行 
策略 上 一 个 要 比 另 一 个 略为 复杂 一 些 。 单 个 进程 的 Acc 总 是 undqefined。 

顺 看 文件 内 容 接 者 往 下 看 , 后 面 还 有 一 个 包含 类 似 的 initial_calls 和 spawneq_as 项 的 进程 数 











据 摘 要 : 
物 CNT ACC OWN 
[{ "<0.50.0>", 2011,undefined, 29.338} 
{ Spawned _ by, "<0.38.0>"}, 
{ spawned as, {erlang,apply, ["HtFun<profile ex.0.133762870>",[]]}}, 


{ jnitial calls, [{erlang,apply,2}, {profile ex,'-run/0-fun-0-',0}]}]. 


显然 这 就 是 profile_ex:run() 浅 生 的 另外 一 个 进程 了 。 从 spawnedq_by 可 以 看 出 这 两 个 进 
程 的 父 进程 相同 。( 从 进程 标识 符 <0.50.0> 还 可 以 看 出 , 虽然 这 个 进程 出 现 的 次 序 靠 后 , 但 它 的 派 
生 时 间 比 为 一 个 进程 要 来 得 早 。) 分 别 累加 两 个 进程 的 CNT 列 和 owN 列 ， 绪 果 与 文件 开头 处 的 总 和 
大 致 相等 。 

进程 数据 摘要 之 后 〈 至 下 一 个 进程 摘要 之 前 ) 是 该 进程 调用 的 郴 数 ， 每 个 “段落 ”( 对 应 于 
一 个 Erlang 项 式 ) 一 个 函数 。 壁 如 : 














{[{{profile ex, funner,1)}, 1 ， 49.047,， 0.0251}, 
{{profile ex,funner,2}, 1000 ， 0.000， 20.692}1,， 
{ {profile ex,funner,2}, 1]001, 49.047, 20.717}, 物 
[{{profile ex, -funner/1-fun-0-',1}), 1060 ， 28.217， 18.482}, 

{suspenga, 1 ， 0.113, 0.000}, 

{{profile ex, funner,2}, 1000,， 0.000, 20.692}1]1}. 











每 个 段落 中 都 有 一 行 末 尾 标 有 s% 一 一 屠 一 行 指 代 的 是 该 段 洲 所 关注 的 水 数 ， 在 这 里 ， 这 个 师 
数 就 是 profile_ex:funner/2。 它 总 共 被 调用 了 1001 次 ， 共 耗 时 49.047 宣 秒 ， 其 中 它 目 身 占 用 
了 20.717 坚 秒 。 在 gs 标记 以 上 ， 每 行 代 表 该 男 数 的 一 个 调用 方 ， 其 中 funner/1 调 用 了 1 次 ， 
funner/2 调 用 了 1000 次 。 对 照 代 码 清单 14-1， 评 测 数 据 与 代码 逻辑 完全 相符 。 

在 %$ 标 记 以 下 ， 每 行 代表 一 个 锌 该当 数 调 用 的 函数 。 可 以 看 到 它 不 光 调 用 了 自己 1000 次 ,还 
调用 了 '-funner/1-fun-0'/1 1000 次 。 这 就 是 funner 进 程 在 总 调用 次 数 上 比 looper 进 程 多 出 
1000 次 调用 的 原因 。 

最 后 ， 还 可 以 看 出 进程 在 该 郴 数 上 挂 起 了 一 次 ， 历 时 0.113 毫 秒 。 进 程 挂 起 也 被 当做 图 数 调 
用 写 和 人 本 文件 ， 甚 至 还 独占 一 个 段落 : 




















{[{{erlang,apply,2}, 1 ， 293 .427， 0.000}, 
{{profile_ ex, funner,2}, | 0O.113, 0.000}], 
{ suspend, 2 29.540,， 0.000},， 物 


[ 1}. . 
代表 进程 挂 起 的 那 一 行 由 g% 标 出 。 这 一 段 指出 该 进程 分 别 在 srlang:apply/2 和 funnerv2 上 挂 
起 过 一 次 ， 共 计 29.540 毫 秒 。 垃 圾 回收 用 时 也 以 相同 的 方式 列 出 : 
{[{{profile ex,'-funner/1-fun-0-',1}, 6, 日 了 0O.357}]， 


{ garbage_ collect, 6, 0O.357, 0.357}, 物 
[ ]}. 
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由 此 可 知 该 进程 执行 了 6 次 垃圾 回收 ， 共 耗 时 0.357 恋 秒 。 

学 会 诠释 这 些 文件 的 方法 之 后 ,你 便 会 发 现 它们 一 点 儿 也 不 神秘 ， 非 第 人 简单。 然而 在 面 对 特 
定 应 用 时 ， 要 想 清晰 诠释 评测 数据 中 每 个 数字 的 含义 ， 就 完全 是 万 外 一 回 事 了 。 

不 妨 将 进程 挂 起 次 数 和 垃圾 回收 次 数 作为 性 能 评测 数据 分 析 的 切 人 点 。 当 进程 等 待 消息 ,或 
调度 甫 将 东 个 进程 暂停 以 方便 其 他 进程 运行 时 ,进程 便 会 挂 起 。 所 谓 垃 圾 回收 ， 就 是 运行 时 系统 
追踪 并 回收 先前 由 进程 分 配 但 现在 已 经 不 再 使 用 的 内 存 的 过 程 ,垃圾 回收 各 还 负责 按 需 增 减 进程 
的 堆 。 执 行 大 量 WO 操 作 或 总 每 看 接收 消 居 的 进程 会 时 第 挂 起 。 分 配 大 量 临时 数据 的 进程 则 会 在 
垃圾 回收 上 耗费 更 多 的 时 间 。, 优先 观察 挂 起 和 垃圾 回收 情况 有 助 于 快速 判断 进程 间 的 耗 时 差 腊 是 
个 由 这 两 个 因素 导致 。 











fprof 文件 中 的 陷阱 
跟踪 记录 文件 中 充斥 着 大 量 数字 ,解读 起 来 让 人 头晕 目眩 。 有 时 候 简单 的 累加 会 让 你 误 入 
歧途 ， 如 以 下 两 种 情况 。 
口 在 复杂 的 相互 递归 "操作 中 ， 函 数 的 ACC 时 长 会 不 准 。 
口 在 测定 物理 耗 时 时 ， 操作 系统 的 调度 机 制 会 干扰 执行 时 间 。 碰 到 这 种 情况 的 时 候 ， 你 
会 发 现 茶 个 函数 明明 没 干什么 事情 ， 耗 时 却 不 短 。 要 是 觉得 不 对 头 ， 那 么 最 好 重新 再 
来 一 次 ， 好 做 个 比较 。 
不 要 锚 铁 必 较 地 瘟 算 每 一 毫秒 的 去 向 。 将 整个 文件 视 作 一 个 整体 , 这 样 才 能 快速 定位 耗 时 
最 多 的 位 置 。 


对 比 looper 进 程 和 funner 进 程 的 挂 起 时 间 ， 你 会 发 现 两 者 基本 相同 (分别 是 32.649 和 29.540 


{[{{profile ex,looper,1}, 1 ， 32 .224， 0.000}, 
{ {erlang,apply,2}, 二 DO.425， 0O.000}], 
{ suspend, 2 ， 32 .649， 0.000},， 各 


ee 
再 对 比 一 下 垃圾 回收 时 间 ， 你 会 发 现 两 者 都 很 小 ( 分别 是 0.164 和 0.357 毫 秒 )。 每 次 测量 ， 这 
两 个 数值 间 的 差 值 都 会 波动 ， 但 无 论 如 何 都 只 占 总 执行 时 间 的 一 小 部 分 : 


{[{{profile ex,looper,1}, 6 ， 0.164, 0.164}],， 
{ garbage_collect, 6, 0O.164, 0.164}, 物 
[ 了 和 


抛 开 这 些 ， 现 在 来 看 看 每 个 进程 都 调用 了 哪些 遇 数 。 我 们 曾 在 描述 funner/2 国 数 的 段落 中 
看 到 该 男 数 累计 耗 时 20.717 人 毫秒; 而 它 又 调用 了 图 数 ' -funner/1-fun-0-' /1, 文件 中 描述 后 者 











的 段落 如 下 : 
{[{{profile ex, funner,2}, 1000 ， 28.217， 18.482}],， 
{ {profile ex,'-funner/1-fun-0-',1}, 1000 ， 28.217， 18.4821},， 各 
[{{erlang,integer to list,1}, 1000 ， 9.378, 9 .378}, 
{garbage_ collect, 6 ， 0.357, 0.357}]}. 


Q) mutually recursive， 指 A 调用 B，B 叉 反 过 来 调用 A 进而 形成 递归 的 情况 。 一 一 译 者 注 
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funnezr/1L 中 的 名 n 表 达 式 共 耗 时 18.482 毫 秒 ， 在 这 个 fon 困 数 中 ，:integer_to_1ist/1 又 耗 
费 了 9.378 友 秒 。 儿 个 数值 加 起 来 大 约 是 48.5 坚 秒 , 跟 funner 进 程 总 的 oOwN 时 长 (48.973 曼 秒 ) 相近 。 
这 下 这 个 进程 的 时 间 秦 在 哪里 束 一 日 7 然 了 。 

骨 看 看 looper/1 哨 数 对 应 的 段落 , 可 以 看 到 它 的 OowN 时 长 是 19.649 至 秒 , 其 中 它 卫 接 调用 的 
integetr_to_1ist/1L 耗 时 9.$05$ 毫 秒 ( 跟 funner 进 程 花 在 同一 个 函数 上 的 时 间 相 当 ): 





{[{{profile ex, -run/0-fun-0-',0}, 1 ， 61 .9542, 0.0211,， 
{{profile ex,looper,1}, 1000 ， 0.000， 19.628}1], 

{ {profile ex,looper,1}, 1001， 61] .542, 19.649}),， 物 
[ {suspend, | 32.224, 0.000}, 
{{erlang,integer to list,1}, 1000, 9.505, 9.505}, 
{garbage collect, 6, 0.164, 0.1641}, 
{{profile ex,looper,1}, 1]000, O000., 19.628}11}. 


这 两 个 数 加 起 来 大 约 是 29.2 上 毫秒 ,非常 接近 looper 进 程 的 owN 时 长 。 现在， 两 个 进程 的 耗 时 都 
已 经 清楚 了 ,二 者 之 间 的 差异 也 凸显 出 来 : fbnner 进 程 中 的 fan 函数 在 1000 次 调用 中 一 共 耗 费 了 大 
约 19 坚 秒 ， 平 均 每 次 fan 男 数 调用 耗 时 19 微 秒 。 

回顾 代码 清单 14-1 中 的 代码 ,很 容易 看 出 相 较 于 looper/1，funner/1 更 为 耗 时 (除非 编译 
希 能 够 通过 内 联 优化 消去 fan 函数 调用 )。 我 们 利用 fprof 证 明了 一 件 显而易见 的 事实 ， 当 然 重 点 并 
不 在 此 ， 而 在 于 让 你 学 会 如 何 诠 释 这 些 文件 并 从 中 查 出 耗 时 瓶 贷 所 在 。 

cprof 和 fprof 为 你 的 系统 性 能 分 析 之 旅 葛 定 了 良好 的 基础 。 它 们 既 有 助 于 评估 代码 中 的 问题 ， 
又 可 以 在 修复 问题 之 后 量化 优化 效果 。 

然而 有 些 时 候 ， 即 便 定 位 了 问题 所 在 ,代码 中 导致 问题 的 原因 也 还 是 让 人 不 明 就 里 。 在 下 一 
节 中 ， 我 们 将 对 Erlang 声 言 的 一 些 陷阱 和 缺陷 进行 讨论 ， 从 而 在 日 浓 开 发 中 予以 规避 。 


14.3 ”Erlang 编程 语言 的 缺陷 


Erlang 代 码 具 有 较为 良好 的 可 读 性 , 其 原因 之 一 就 在 于 语义 简明 ”。 大 部 分 情况 下 , 每 个 操作 
的 成 本 都 清晰 可 辨 . 没有 隐 式 调用 的 对 象 构造 哨 数 和 术 构 函数 ， 没 有 运算 从 午 载 ( 因此 + 运算 符 
绝 不 可 能 偷偷 摸 措 地 复制 整个 对 象 )， 没 有 虚 郧 数 表 市 来 的 间接 调用 ， 没 有 临界 区 ， 也 没有 阻塞 
式 的 消息 发 送 原 语 。 当 然 ， 函 数 调 用 几乎 是 “无 所 不 能 ”的 ,它们 的 行为 并 不 一 日 7 然 , 但 通常 
每 个 函数 都 附 有 清晰 的 文档 ( 至 于 那些 你 尚未 人 猎 读 过 文档 , 或 者 压根 儿 束 没有 文档 的 函数 ， 束 要 
小 心 了 )。 

和 任何 编程 语言 一 梓 ，Erlang 也 不 可 避免 地 具有 一 些小 小 的 缺陷 。 不 妨 先 从 Erlang 的 基本 数 
据 类 型 说 起 。 谈 到 性 能 优化 ， 总 少不了 它们 。 基 本 数据 类 型 是 语言 中 应 用 最 多 的 部 分 ,选用 恰当 
的 数据 表现 形式 和 数据 处 理 方式 可 以 令 你 事半功倍 。 

































































中 很 多 人 对 Erlang 代 码 可 读 性 良好 的 观点 不 以 为 然 ， 甚 至 挪 的 Erlang 的 语法 有 损 视 力 ( Erlang 效 脚 的 语法 主要 源 自 
Prolog， 相 关 历 史 可 以 参考 “A History of Erlang”)。 然 而 语法 和 语义 是 两 回 事 ,一 旦 适应 了 了 Erlang 的 语法 和 子 数 式 
编程 风格 ， 你 便 会 发 现 相 较 于 C++ 等 语言 来 说 ，Erlang 的 语义 的 确 更 易于 把 握 。 一 一 译 者 注 
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14.3.1 基本 数据 类 型 的 性 能 特点 


首先 请 注意 ，Erlang 的 数据 类 型 的 大 小 是 以 机 器 字 (machine word ) 为 单位 来 计算 的 。 这 是 
由 BEAM 模 拟 需 的 工作 机 制 决 宪 的 。 在 32 位 机 天 上 ， 一 个 字 长 4 字 贡 ;在 64 位 机 关上 ， 一 个 字 长 8 
字 方 。 表 14-1 总 结 了 各 种 基本 数据 类 型 的 大 小 。 


表 14-1 Erlang 数据 类 型 的 大 小 
































数据 类 型 内 存 占用 量 
小 整数 ( 立即 数 ，immediate ) 1 个 字 
大 整数 ( 大 数 ，bignum ) 至 少 3 个 字 ( 可 按 需 增长 ) 
浮 点 数 在 32 位 架构 下 占 4 个 字 ， 在 64 位 架构 下 占 3 个 字 
原子 1 个 字 〈 原子 的 名 称 字 符 串 仅 存 在 于 Erlang 方 点 的 原子 表 中 ) 
二 进 制 串 或 位 串 3 至 6 个 字 + 数 据 长 度 ( 以 字 为 单位 ) 
pid、 端 口 或 引用 本 地 进程 /端口 /引用 占 1 个 字 ， 远 程 进程 /端口 /引用 占 5 个 字 
fun 也 数 9 至 13 个 字 + 被 财 包 捕获 的 变量 每 个 占 1 个 字 
元 组 2 个 于 4 每 个 元 训 1 个 守 
列表 1 个 字 + 每 个 元 素 两 个 字 


让 我 们 来 看 看 这 些 数据 类 型 在 性 能 方面 前 有 些 什么 特点 。 在 以 下 的 讨论 中 ，fun 函 数 可 被 视 
作 带 有 额外 元 数据 的 元 组 ， 而 pid ( 以 及 端口 和 引用 ) 则 与 整数 相似 。 

1. 小 整数 

小 整数 仅 占 一 个 字 的 内 存 , 不 过 BEAM 会 将 这 个 字 中 的 在 干 比特 位 用 作 类 型 标签 ， 以 便 区 分 
不 同 的 数据 类 型 ， 如 图 14-2 所 示 。 








有 人 第 0 位 
ee 32 位 机 器 字 (4 个 字 节 ) 
28 位 有 符号 “小 整数 ”一 一 一 一 一 一 一 类 型 标签 位 


图 14-2” ”BEAM 中 带 类 型 标签 的 小 整数 。 丰 32 位 机 器 上 ， 可 用 于 存储 整数 值 的 比特 位 
只 有 28 个 。 更 大 的 整数 必须 表示 成 大 数 


在 32 位 机 各 上 ， 可 用 于 存储 整数 值 的 比特 位 只 有 28 个 ( 包括 符号 位 ) 因此 在 单个 字 内 ， 整 
数 的 取 值 范围 为 -134 217 728 到 +134 217 727， 处 理 更 大 的 整数 时 需 换 用 大 数 (bignum )。 

2. 大 数 

在 Erlang 中 整数 的 大 小 不 党 限制 。 一 个 字 长 塞 不 下 时 ， 运 行 时 系统 会 自动 把 它 转换 成 长 度 可 
变 的 大 数 (但 不 可 超出 可 用 内 存 的 大 小 )。 二 者 之 间 唯 一 可 感知 的 区 别 就 是 大 整数 运算 比 小 整数 
运算 有 要 来 得 慑 。 在 市 有 密集 数值 运算 的 紧凑 循环 中 ,如果 给 定 的 输入 会 导致 大 量 大 数 运算 ， 就 会 
产生 较为 明显 的 性 能 差异 。 这 时 可 以 对 程序 进行 修改 ， 尽 量 使 用 小 整数 来 完成 运算 。 
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3. 浮 点 数 及 其 装 箱 形式 

Erlang 米 用 的 是 64 位 精度 的 浮 点 数 ， 一 个 字 长 容纳 不 下 ( 即便 在 64 位 机 各 上 也 放 不 下 ， 和 小 
整数 的 情形 一 样 ，BEAM 会 将 一 些 比特 位 用 作 类 型 标签 )。 因 此 ， 浮 点 数 必须 表示 成 装 箱 形式 : 
在 这 种 形式 下 , 浮 点 数 的 实际 数据 保存 于 进程 的 堆 内 存 空间 内 , 指 问 该 位 置 的 指针 连同 类 型 标签 
一 并 挤 入 一 个 字 。 这 样 一 来 , 无论 是 用 作 也 数 参数 还 是 用 作 数 据 结 构 的 成 员 , 需要 该 浮 点 数 时 只 
需 复 制 这 个 字 便 可 。 接 春来 看 位 于 堆 上 的 数据 ， 第 一 个 字 用 于 摘 述 数据 类 别 〈 浮 点 数 ) 及 数据 长 
度 。 紧 随 其 后 的 才 是 真正 的 64 位 浮 点 数 : 在 32 位 机 器 上 占 两 个 字 长 ， 在 64 位 机 器 上 占 一 个 字 长 。 
如 图 14-3 所 示 。 




















标记 指针 占 2 个 比特 位 的 标签 


首 字 


第 一 个 数据 字 第 二 个 数据 字 
堆 内 存 








图 14-3” 浮 点 数 和 大 数 等 一 个 字 放 不 下 的 值 的 装 箱 形式 。 将 这 些 值 传 给 困 数 或 插 和 人 
别 的 数据 结构 时 ， 只 需 传递 标记 指针 


除 浮 点 数 外 ,还 有 几 种 基本 数据 类 型 也 采用 装 箱 形式 ,包括 大 数 ( 这 就 是 大 数 至 少 要 占 三 个 
字 长 的 原因 ) 和 元 组 。 

4. 原子 

原子 的 情形 与 小 整数 类 似 : 每 个 原子 只 占 一 个 字 。 原 子 的 名 称 字 符 串 保存 在 一 张 原 子 表 中 ， 
每 个 Erlang 玉 点 只 存 一 份 。 原 子 所 占用 的 那个 字 中 保存 的 实际 上 是 原子 表 中 对 应 名 称 字 符 串 的 索 
引 。 因 此 ， 原 子 的 相等 比较 跟 小 整数 的 相等 比较 一 样 快 "。 由 于 效率 高 ， 原 子 被 广泛 用 作 标 记 元 
组 的 标签 。 模 块 加 载 时 ， 模 块 中 尚未 加 入 表 中 的 原子 会 被 全 部 加 入 表 中 ; 此 外 ， 当 前 节点 收 到 的 
发 目 其 他 节点 的 新 原子 ， 以 及 调用 1ist_to_atom(NameString) 产 生 的 新 原子 ， 都 会 被 写 入 原 
子 表 。 然 而 原子 不 会 被 垃圾 回收 ,插入 表 中 的 原子 即便 永 不 再 使 用 也 不 会 被 删除 ， 清 理 这 张 表 的 
唯一 途径 就 是 重启 节点 。 









































动态 创建 原子 会 造成 内 存 泄漏 

出 于 种 种 目的 ，Erlang 初学 者 往往 会 动态 创建 原子 : x1、x2、…、x187634， 诸 如 此 类 。 
对 于 那些 一 次 性 的 、 跑 完 就 会 关闭 Erlang VM 的 程序 来 说 ， 生 成 几 百 甚至 几 千 个 原子 完全 没 问 
题 。 然 而 原子 表 的 容量 是 有 限 的 ， 目 前 只 能 容纳 一 百 多 万 项 。 一 旦 溢出 ，VM 便 会 报 出 “超出 
系统 限制 ”( System limit ) 错误 ， 然 后 前 渍 。 小 程序 一 般 不 会 超出 这 个 限制 ， 但 对 于 需要 长 时 


J 只 需 比较 索引 值 是 否 相 等 。 一 一 译 者 注 
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间 运 行 的 线 上 系统 来 说 这 个 问题 却 是 致命 的 。 

璧 如 ， 在 将 服务 器 接收 到 的 外 来 数据 转换 成 Erlang 消息 时 就 得 特别 小 心 。 外 来 数据 中 的 
字符 串 应 该 转换 为 Erlang 字符 串 或 二 进 制 串 ， 要 是 转 成 了 原子 ， 那 就 等 着 中 招 吧 : 攻击 者 只 
需 发 送 大 量 互 不 重复 的 字符 串 便 可 以 把 节点 摘 震 。 








原子 主要 用 于 表示 静态 的 标识 符 集 合 。 需 要 多 少 用 多 少 , 但 千 万 不 要 放任 不 可 信 的 数据 源 随 
意 生 成 原子 。 在 将 字符 串 转换 为 原子 时 ,可 以 考虑 使 用 BIF list_to_existing_atom 
(NameString) ， 它 只 会 生成 系统 中 已 知 的 原子 。 倘 知 原 子 表 中 没有 与 字符 串 相 对 应 的 原 于 ， 该 
国 数 将 抛 出 异 稼 。 
5. 二 进 制 串 和 位 串 
二 进 制 串 和 位 串 (参见 2.2.2 节 ) 不 过 是 些 字 市 片段 。 它们 的 表现 形式 和 大 数 类 似 , 但 却 更 为 
复杂 ， 因 为 底层 实际 上 存在 奋 干 种 对 上 层 不 透明 的 不 同类 型 的 二 进 制 串 。 它 们 主要 分 为 两 类 : 
口 堆 型 二 进 制 串 〈 较 小 ) 最 大 64 字 市 。 它 们 跟 浮 点 数 和 大 数 一 样 ， 保 存在 进程 自身 的 堆 中 。 
和 其 他 Erlang 数 据 类 型 一 样 ， 在 进程 间 传 递 消息 时 ， 这 类 二 进 制 串 的 数据 会 被 一 并 复制 。 

口 引用 计数 型 二 进 制 串 〈 较 大 ) 保存 在 单独 的 、 为 所 有 进程 所 共享 的 全 局 内 存 区 域 中 ， 这 
些 二 进 制 串 采 用 引用 计数 式 垃 圾 回收 。 在 同一 VM 内 的 多 个 进程 之 间 传 递 这 类 大 型 二 进 制 
串 时 无 有 顷 复制 数据 ， 只 需 传递 一 个 指针 即 可 。 有 了 这 一 机 制 ， 我 们 便 可 以 让 一 个 进程 从 
文件 或 端口 中 谈 取 数据 ， 再 将 放出 的 数据 发 送 给 另 一 个 进程 进行 处 理 ， 完 全 不 用 担心 数 
据 复 制 的 开销 。 通 晓 底 层 的 实现 机 制 回 然 是 件 好 事 ， 然 而 一 味 利 用 这 些 鲜 为 人 知 的 特性 
育 目 追求 性 能 却 绝 非 上 策 。 

Erlang 一 进 制 串 的 语法 很 强大 ， 也 很 容易 用 错 ， 有 要 做 到 运用 上 自如 绝 非 多 事 ， 在 循环 中 人 处理 二 
进 制 数据 尤其 困难 。 一 个 快速 判断 二 进 制 串 处 理 效 率 的 方法 就 是 启用 bin_opt_info 编 译 选项 ， 
壁 如 将 系统 环境 变量 ERL_COMPILER_OPTIONS 设 置 成 [bin_opt_info]。 设 置 该 选项 后 ， 编 译 
融会 专门 针对 代码 中 的 二 进 制 串 输出 一 些 项 有 助 益 的 警告 和 信息 。 

6. 元 组 

元 组 的 情况 就 相当 简单 了 。 有 要 知道 元 组 是 只 读数 据 结 构 ， 更 新 就 意味 着 复制 。 男 外 ， 记 录 实 
际 上 也 是 元 组 ， 所 以 更 新 记录 字段 就 意味 者 创建 新 的 元 组 : 更 新 一 个 含有 10 个 字段 的 记录 ， 上 总 共 
要 与 12 个 字 。 但 男 一 方面 ,元 组 或 记录 中 的 字段 选取 操作 却 非常 之 快 。 俐 而 言 之 ， 要么 快速 读 取 
要 么 快速 更 新 ， 鱼 和 能 党 不 可 兼 得 。 对 于 恒定 不 变 的 数据 ,将 大 型 元 组 用 作 数 组 可 以 提高 访问 效 
率 , 但 更 新 效率 堪忧 。 如 果 将 元 组 瞬 套 成 树 状 结构 , 虽然 会 引入 多 次 间接 寻 址 从 而 降低 读 取 速 度 ， 
但 更 新 操作 的 效率 却 会 得 到 提升 。 标 准 库 中 的 array 模 块 采 用 的 就 是 这 种 做 法 。 

7. 列表 

列表 的 表现 形式 和 编程 注意 事项 剖面 已 经 讨论 过 了 (参见 2.2.5 市 、2.2.10 方 、2.15.5 广 和 附录 
B ), 这 里 只 说 说 列表 的 内 存 占 用 情况 。 回 想 一 下 先前 探讨 过 的 浮 点 数 的 北 箱 形式 , 列表 单元 也 差 
不 多 ,， 它 与 二 元 组 类 似 ,但 在 实现 层面 存 有 一 个 关键 的 差异 点 : 列表 单元 (1ist cell ) 的 第 一 
个 字 包 含 一 个 特殊 的 类 型 标签 和 一 个 指针 ,其 中 标签 表明 这 是 一 个 列表 单元 , 指针 则 指 癌 其 余 的 
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位 于 堆 上 的 数据 。 为 了 指明 类 型 和 元 组 的 长 度 , 二 元 组 位 于 堆 上 的 数据 的 最 前 端 有 一 个 用 于 保存 
这 些 附加 信息 的 首部 字 ; 然而 列表 单元 的 元 素数 固定 为 两 个 , 无 须 这 些 附 加 信息 ， 只 需 推 上 的 两 
个 字 即 可 完整 表示 一 个 列表 单元 (参见 2.2.10 市 中 的 图 2-1 和 图 2-2 )。 这 一 设计 有 效 保 障 了 用 做 通 
用 数据 结构 的 Erlang 列 表 的 效率 。 

















字符 串 的 内 存 占用 量 

字符 串 本 质 上 就 是 字符 构成 的 列表 , 字符 的 数值 编码 都 是 小 整数 ， 可 以 完整 放 入 列表 单元 
的 第 一 个 字 内 。 因 此 字符 串 中 的 每 个 字符 刚好 占用 两 个 字 。 将 较 短 的 字符 串 ( 比方 说 短 于 10 000 
个 字符 ) 用 做 临时 数据 结构 不 成 问题 。 但 如 果 将 文本 以 字符 串 ( 即 字符 数值 编码 列表 ) 形式 存 
入 数据 库 、ETS 表 或 别 的 数据 结构 中 ,就 会 造成 空间 的 大 量 浪费 。 将 字符 串 转 换 成 二 进 制 串 可 
以 将 空间 占用 缩减 至 1/8 (在 64 位 机 器 上 是 1/16 )。 另 一 方面 ， 也 得 考虑 下 这 样 做 是 否 便利 : 
如 果 内 存 充 裕 ， 当 前 空间 占用 根本 不 是 问题 ,那么 将 代码 中 的 字符 串 都 换 成 二 进 制 串 可 能 并 不 
值得 ， 如 果 还 要 赔 上 代码 的 可 读 性 ， 那 就 更 加 得 不 伟 失 了 。 


有 关 基 本 数据 类 型 的 讨论 就 到 此 为 止 了 了。 下 一 市 将 对 Erlang 的 BIF 及 运算 符 的 性 能 问题 展开 


讨论 。 
14.3.2” 内置 函数 和 运算 答 的 性 能 


Erlang 定 义 了 大 量 运 算 符 和 BIF。 作 为 运行 时 系统 的 一 部 分 ,它们 都 是 用 C 写 成 的 ,一般 来 说 
效率 不 成 问题 ,但 我 们 仍然 有 必要 考量 它们 的 一 些 隐 含 的 性 能 问题 。 在 这 一 他 中 , 我 们 将 揭示 与 
以 下 功能 相关 的 几 个 第 见 的 陷阱 : 

DD ++ 














口 
[Tist to atom(Charligst) 
DD length (List) 
UD size (Thing) 

1. ++ 运 算 符 

我 们 曾经 在 在 2.2.5 入 和 2.15.5 市 的 末尾 讨论 过 这 个 问题 ， 这 里 只 是 重复 强调 一 裔 : 不 要 放任 
列表 目 右 侧 增长 ! 此 外 还 应 注意 ++ 运 算 符 只 是 1ists:append/2 的 一 个 别名 , 这 个 问题 对 该 函数 








同样 适用 。 
2. -- 运 算 符 





-- 运 算 符 是 1ists:subtract/2 的 别名 。 这 个 运算 符 并 不 稼 用 : 它 的 作用 是 从 左 侧 列 表 中 删 
除 右 侧 列表 中 的 元 系 。 然而 , 针对 右 侧 列表 中 的 每 一 个 元 系 ，-- 运 算 符 只 会 删除 左 侧 列表 中 目 左 
往 右 出 现 的 第 一 个 匹配 项 。 因此 要 想 完 全 删除 指定 的 元 系 , 就 必须 知道 该 元 系 在 左 侧 列 表 中 的 出 
现 次 数 。 参 见 以 下 示例 : 


1> [ly2p3.2.1] —— [27lr21: 
[3,1] 
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可 见 ， 被 删除 的 元 又 包 括 左 侧 的 第 一 个 1 和 两 个 2，3 则 不 受 影 响 。 元 又 的 次 友 也 不 受 影响 。 

这 个 函数 的 缺点 在 于 它 用 的 是 平方 复杂 度 的 算法 : 针对 右 侧 列 表 中 的 每 个 元 素 , 都 要 对 左 侧 
列表 做 一 次 壳 历 。 列 表 较 短 时 表现 并 不 明显 ; 但 一 旦 碰 上 长 列表 ， 就 很 成 问题 了 。 如 采 元 素 的 次 
序 并 不 重要 ， 那 么 更 为 高 效 的 做 法 是 先 排序 ， 再 调用 ordqsets : subtract/2。 

3.1list to atom/1 

切记 原子 无 法 被 垃 圾 回收 ， 务 必 小 心 使 用 这 个 函数 。 在 某 些 应 用 场景 下 也 许 list_to_ 
existing_atom/1 会 更 为 合适 ， 详 情 参见 14.3.1 人 中 和 原子 相关 的 讨论 。 

4. length/1 

请 记 住 为 了 计算 元 素数 目 ，lengtnh (List) 必须 所 历 整 张 列 表 ， 这 点 与 计算 字符 串 长 度 的 
C 子 数 strlen 很 相似 。 有 Java 开 发 痛 景 的 程序 员 往 往 会 忽略 这 点 ， 以 为 这 是 个 常数 复 森 度 的 操 
作 一 一 非 也 ! 在 硅 干 第 见 场景 下 可 以 利用 模式 匹配 来 殖 代 lengthn/1， 详情 请 参见 2.15.5 市 的 
末尾 。 

D. size/1 

length/1 和 size/1 的 适用 范围 很 容易 混 消 : length/1 仪 适用 于 列表 ，size/1 同 时 适用 于 
元 组 和 二 进 制 串 ,但 不 适用 于 列表 。 二 者 之 间 的 区 别 在 于 size/1 是 常数 操作 ， 无 须 遍 历 所 有 数 
据 ， 因 此 非常 迅捷 。 然 而 size/1 也 数 既 适用 于 元 组 又 适用 于 二 进 制 串 这 一 点 却 又 会 导 人 致 一 些小 
小 的 兵 烦 ， 因 为 该 也 数 用 于 前 者 时 返回 的 是 元 素数 ， 用 于 后 者 时 返回 的 却 是 字 市 数 。 光 看 代码 ， 
我 们 很 难 分 状 参 数 中 给 定 的 是 元 组 还 是 二 进 制 串 , 搞 不 清 这 一 点 , 就 更 搞 不 清 冰 数 返回 的 数值 究 
竞 代表 什么 意义 了 。 这 种 情况 会 让 Dialyzer 等 代码 检查 工具 抓 睹 ， 难 以 发 现 潜 在 的 错误 。 

在 现代 Erlang 代 人 码 里 , 我们 推荐 用 tuple_size (7T) 获取 元 组 的 元 系数 , 用 byte_size(B) 或 
bit_size(B) 获取 二 进 制 串 或 位 串 中 的 字 市 数 或 比特 位 数 。 对 于 (长 度 不 可 被 8 整除 的 ) 位 串 ， 
byte_size(B) 会 同上 取 整 一 一 也 就 是 说 ， 它 返回 的 是 能 容纳 B 中 所 有 比特 位 的 最 小 字 太 数 。 使 
用 这 些 隐 数 可 以 清晰 地 表明 意图 ， 而 且 可 以 为 编译 从 和 Dialyzer 工 具 提 供 关 键 线索 。 

现在 BIF 和 运算 符 也 讨论 完了 ， 下 面 我 们 来 说 说 普通 的 用 户 目 定义 函数 的 效率 。 




















































































































14.3.3 ”函数 


在 必要 的 情况 下 ， 有 效 运 用 困 数 可 以 再 “ 榨 出 ” 几 毫 秒 。 在 这 一 方面 ， 你 可 能 会 有 些 困惑 和 
误解 。 我 们 不 妨 从 表 14-2 开 始 ， 这 张 表 总 结 了 各 种 函数 调用 方式 的 耗 时 情况 。 


表 14-2 ”函数 调用 速度 














函数 调用 类 型 耗 时 
本 地 滑 数 : foo () 非常 快 
已 知 的 远程 函数 : bar :foo() 几乎 和 本 地 函数 调用 一 样 快 
未 知 的 远程 函数 : Mod:Func () 大 约 比 本 地 调用 慢 3 售 
Fun 孙 数 调用 : F() 比 本 地 调用 慢 2 ~ 3 倍 
元 调用 : apply (Mod, Func, Args) 比 本 地 调用 慢 6 ~ 10 售 
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绝对 耗 时 取决 于 硬件 速度 ， 相 对 耗 时 也 会 随 编 译 咒 和 运行 时 系统 的 版 本 而 变化 。 例 如 ，( 在 
多 年 以 前 ) 调用 其 他 模块 中 的 也 数 比 调用 本 地 咀 数 要 慢 得 多 。 现 如 今 ， 二 者 已 经 差不多 了 。 从 表 
14-2 可 以 看 出 ,除非 是 对 性 能 要 求 极其 苛刻 的 代码 ， 否则 一 般 情 况 下 无 须 太 过 关注 函数 调用 的 开 
销 : 只 有 元 调用 的 速度 显著 落后 ， 不 过 它 本 来 就 不 常用 。 请 记 住 ， 在 参数 数目 固定 的 情况 下 ， 
Mod:Fun(...) 形 式 优 于 apply/3。 

1. 尾 递 归 和 非 尾 递归 

在 2.1$.2 闻 中 我 们 曾经 讨论 过 尾 递 归 和 非 尾 递归 。 它 们 之 间 的 关系 类 似 于 本 地 调用 与 远程 调 
用 的 关系 , 一般 情况 下 非 尾 递 归 比 尾 递 归 要 慢 。 归 功 于 运行 时 系统 和 编译 需 的 进步 ， 如 今 二 者 之 
间 的 差异 已 经 很 小 了 ， 较 为 优雅 的 非 尾 递归 函数 在 效率 上 跟 尾 递归 版 本 往往 相差 无 几 。 

在 速度 至 关 重 要 的 情况 下 ， 如 果 有 精力 把 尾 递 归 版 本 和 非 尾 递 归 版 本 各 实现 一 遍 ( 依 具体 
问题 而 不 同 ， 其 中 一 个 版 本 实现 起 来 会 更 为 容易 )， 就 不 要 万 作假 设 一 一 对 比 两 个 版 本 的 评测 数 
据 ， 证 数字 说 话 。 受 缓存 实现 策略 等 因素 的 影响 ， 不 同 便 件 平台 下 的 结果 可 能 会 有 所 不 同 。 此 
外 ,输入 数据 的 规模 也 会 产生 显著 影响 ( 输入 规模 决定 递归 深度 )， 小 规模 输入 和 大 规模 输入 都 
应 予以 评测 ; 大 多 数 情 况 下 输入 规模 如 何 ， 最 差 情 况 和 平均 情况 下 的 耗 时 是 否 关 键 , 这 些 都 得 考 
慰 请 年， 

2. 子 句 选择 

磅 到 含有 多 个 子 句 的 函数 或 fun 表 达 式 ( 也 包括 case、if、try 或 receive 表 达 式 ) 时 ,为 
了 快速 选 出 合适 的 子 句 ， 编 详 希 会 尽量 削减 判断 次 数 。 这 和 套 名 为 模式 匹配 编译 的 算法 会 将 子 句 分 
组 排序 ， 再 切 分 成 一 系列 瞬 套 的 if/then/else 判 断 。 然 而 它 只 会 调整 判断 的 执行 次 序 ，( 除 提 
速 以 外 ) 不 会 影响 输出 。 

譬如 , 判断 输入 是 原子 true 还 是 false 时 ,判断 次 序 无 天 紧要 ， 因 为 二 者 是 互 斥 的 : 它们 不 
可 能 同时 成 立 。 类 似 的 判断 还 包括 检验 列表 是 否 为 空 等 。 然 而 某 些 情况 下 多 个 选项 会 相互 覆盖 ， 
以 下 列 函 数 为 例 


coffee size{N})} when N < 12 -> short:; 
coffee size({N) when N < 16 -> tall; 
coffee size{N) 

























































































when N < 20 -> grande; 
coffee sizet{ ) -> Venti. 


限 数 的 逻辑 受制 于 判断 的 次 序 ， 如 果 对 调 最 上 方 的 两 个 子 名 ,包括 所 有 小 于 12 的 N 在 内 ， 
所 有 小 于 16 的 N 都 会 得 出 tal1。 编 详 天 只 会 调整 那些 安全 无 席 的 子 句 的 次 序 , 其 余 内 容 则 保留 
有 一 点 需要 注意 的 是 ， 不 要 在 简明 的 子 句 之 间 择 入 市 有 不 确定 性 的 子 名 。 以 下 列 代码 为 例 : 


handle messa 











gelstop)} -> do stop!(}),; 
handle message (go) -> do_go(); 
handle message 

e 


( 

( 

(Msg) when MSG =:= Special -> do_ special (Msg}: 
handle message (report) -> do_ report(}),; 
handle message (calc) -> do calculate!()}): 
handle messagelOtherMsg}) -> do error (Other)}). 
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该 限 数 的 输入 应 是 指定 的 4 个 原子 之 一 ， 或 是 某 个 特殊 项 式 Sspecial (一 个 运行 时 确定 的 变 
量 )， 遇 到 其 他 项 式 则 报错 。 运 行 时 的 special 有 可 能 同 为 原子 ,但 编译 器 无 从 知晓 。 尤 其 是 ， 
运行 时 的 Sspecial 有 可 能 就 是 原子 report 或 calc 二 者 之 一 ， 这 样 一 来 ，stop、go、report 和 和 
calc4 个 子 句 就 不 能 归并 在 一 起 。 编 诺 希 最 多 也 就 是 把 stop 和 go 判断 归并 为 一 组 ， 接 看 判断 
Special， 再 将 report 和 calc 归 并 为 一 组 。 喘 为 开发 者 ， 如 果 你 确认 special 的 取 值 永远 不 会 
是 report 或 calc， 那 么 就 应 该 把 它 挪 到 另外 两 个 判断 的 下 方 。 仅 就 这 个 示例 而 言 ， 性 能 上 的 差 
异 非常 小 ; 但 要 是 碰 上 很 多 高 有 复杂 模式 的 子 句 ， 对 各 个 判断 进行 恰当 的 分 组 归并 还 是 值得 的 。 
(这样 做 还 会 提升 可 读 性 ， 令 代码 更 为 清晰 地 表达 开发 者 的 意图 。 ) 

在 本 和 草 的 最 后 ， 我 们 来 探讨 一 下 进程 的 效率 问题 。 


























14.3.4 ”进程 


进程 是 所 有 Erlang 程 序 的 基本 执行 环境 。 所 有 代码 都 要 依托 于 进程 才能 执行 。 即 便 是 目 生 不 
启动 任何 进程 的 库 模 块 的 代码 ， 运 行 时 也 要 依托 于 调用 它 的 进程 才 行 。 

如 前 所 述 ，Erlang 中 的 进程 十 分 “廉价 ”。 大 量 进程 并 发 运行 在 Erlang 中 可 谓 司空 见 惯 。 然 而 
每 个 进程 执行 的 工作 却 会 对 整个 系统 的 性 能 产生 显著 影响。 

1. 要 不 要 用 OTP 行 为 模式 

虽然 新 进程 的 创建 仅 需 数 训 秒 ， 但 OTP 行 为 模式 容 融 进程 的 初始 化 却 是 另外 一 回 事 。 
gen_server:start_link() 调 用 会 引发 一 系列 动作 ， 包括 调 用 行为 模式 实现 模块 中 的 init/1 
回调 。 前 文 曾经 提 过 ， init/1 回 调 不 结束 ， start_l1ink 了 畏 数 就 不 会 返回 。 这 一 设计 是 为 了 保证 
服务 启动 过 程 的 确定 性 , 确保 当 调 用 方 拿 到 新 服务 顺 进 程 的 ID 时 , 服务 需 已 经 完成 了 初始 化 并 且 
随时 可 以 接受 请 求 。 

在 某 些 场景 下 ， 大 量 进程 来 去 和 匆匆。 以 第 11 章 中 的 连接 处 理 进程 为 例 ， 代 码 清单 11-3 中 的 
ti_server 便 是 如 此 。 这 类 服务 会 为 每 个 TCP 连 接 派 生 一 个 新 的 进程 。 在 大 压力 下 ， 测 试 数据 表明 
大 量 时 间 被 耗费 在 进程 初始 化 上 。 进 程 的 生存 期 越 短 ， 耗费 在 OTP 库 代码 上 的 时 间 比 就 越 高 。 在 
速度 至 上 的 情况 下 ， 抛 弃 OTP 行 为 模式 ， 转 而 直接 利用 spawn 目 行 打造 轻 量 级 的 进程 管理 机 制 也 
许 更 为 实际 , 这 样 做 可 以 在 最 大 程度 缩减 开销 的 同时 提供 精 科 的 控制 功能 。 然 而 这 种 做 法 很 容易 
出 钳 ， 只 可 用 于 处 理 非 党 情况， 而且 只 有 在 熟练 掌握 进程 和 OTP 编 程 之 后 才 行 ， 这 样 你 才 会 明日 
自己 为 了 性 能 而 放弃 了 些 什么 。 

2. 设置 堆 的 初始 尺寸 

如 果 大 量 进程 在 创建 之 后 快速 消亡 , 那么 还 可 以 采取 另外 一 种 优化 措施 : 调 大 每 个 进程 的 初 
始 堆 大 小 ， 以 避免 垃圾 回收 及 进程 启动 之 后 的 内 存 分 配 。 

进程 堆 的 默认 大 小 是 233 个 字 ( 在 32 位 机 各 上 等 于 932 字 节 )， 后 续 还 可 按 需 增 减 。 这 一 自动 
内 存 管 理 机 制 十 分 方便 , 但 会 带 来 一 定 的 运行 时 开销 。 如 果 能 够 算出 这 些 临 时 进程 在 它们 短暂 的 
生命 周期 内 总 共 需 要 多 少 内 存 ， 就 可 以 在 局 动 它们 时 预先 设置 堆 的 初始 大 小 。 这 一 任务 可 借 由 
spawn_opt 系 列 郴 数 完成 : 
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erljlang:spawn _ opt (Fun, [{min heap size, Words}]) 

在 这 种 方式 下 ,每 个 进程 都 被 视 作 一 块 内 存 区 域 , 这 块 内 存在 进程 启动 时 分 配 ,， 在 进程 结 
时 回收 ， 除 此 之 外 不 再 需要 其 他 内 存 管理 。 如 图 14-4 所 示 。 

这 么 做 的 缺点 在 于 每 个 进程 的 内 存 占 用 量 都 高 于 实际 需要 ， 因 此 实际 上 是 在 拿 内 存 空 间 换 
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普通 进程 .初始 较 小 ， 按 需 增 长 


0:0:O'@- 


大 号 进程 : 调整 初始 大 小 为 所 需 的 尺寸 








轩 = 已 使 用 的 内 存 。 [= 未 使 用 的 内 存 








图 14-4 “为 生存 期 较 短 而 工作 量 较为 固定 的 进程 设置 更 大 的 初始 堆 ， 以 避免 垃圾 
回收 和 堆 大 小 的 调整 


3. 休眠 

如 东 有 大 量 进程 需要 长 期 保持 话 跃 ,， 且 其 中 大 部 分 进程 因 等 竺 消息 而 处 于 睡眠 状态 ， 束 可 以 
考虑 让 这 些 进 程 转 和 人 休眠 状态 。 

调用 erlang:hibernate (Mode，Func，Args) 即 可 令 进 程 休 了 眠 。 休眠 的 进程 会 抛弃 调用 
栈 , 忘却 上 自身 在 程序 中 的 当前 执行 位 置 ,有 鉴于 此 ,hibernate/3 水 不 返回 , 当前 正 活跃 的 catch 
或 try/catch 表 达 式 也 会 被 忽略 。 接着, 将 会 强制 执行 一 次 垃圾 回收 ,精简 进程 的 内 存 占用 。 最 
后 , 进程 进入 睡眠 状态 , 直到 新 消息 再 次 进入 信箱 。( 大 休眠 时 信箱 不 为 空 , 进程 将 被 立即 唤醒 。) 
进程 被 唤醒 后 的 行为 就 仿佛 是 调用 了 apply(Mod,Func, Args)， 不 过 该 “调用 ”没有 返回 地 址 。 

休眠 可 以 精简 睡眠 中 的 进程 的 内 存 占用 , 释放 出 更 多 的 空间 容纳 更 多 的 进程 。 这 一 手法 特别 
适用 于 那些 监控 着 大 量 外 部 实体 的 系统 。 














Ys 


而 不 是 erlang :hibernate/3， 以 确保 进程 桓 来 后 周章 一切 都 遵照 OTP 库 的 约定 再 次 打点 妥当 。 
好 了 ， 人 性 能 相关 的 讨论 就 到 此 结束 了 。 
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14.4 小结 

在 这 一 章 中 ， 我 们 讨论 了 性 能 调 优 的 基本 方法 : 设 定 目标 、 度 量 系统 行为 、 确 定 亟待 解决 
的 问题 , 并 确认 修改 是 否 行 之 有 效 。 你 学 会 了 如 何 使 用 cprof 和 fprof 工 具 来 分 析 代 码 的 执行 时 间 。 
我 们 还 介绍 了 Erlang 代 码 中 和 效率 相关 的 各 种 缺陷 、 陷 阱 和 技巧 。 擎 握 了 这 些 知 识 , 你 便 具备 了 
参与 Erlware 团 队 性 能 优化 工作 的 能 力 。 记 住 ， 代 码 的 执行 效率 固然 重要 ， 但 干 万 不 要 忘 了 代码 
之 美 才 是 最 值得 追求 的 。 
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安 小 Erlang 








随 操作 系统 和 个 人 喜好 的 不 同 , Erlang 的 安装 方法 也 各 不 相同 。 当前, Erlang 在 新 版 Windows、 
Mac OS X、Linux 、 大 部 分 类 UNIX 操 作 系 统 ， 以 及 VxWorks 实时 操作 系统 上 都 可 以 运行 。 


A.1 在 Windows 上 安装 Erlang 


使 用 Windows 操 作 系 统 的 用 户 ， 从 www.erlang.org/download.html 下 载 并 运行 最 新 版 本 的 .exe 
安装 文件 即 可 。 安 逆 文 件 中 宫 括 了 文档 ， 还 会 设置 好 开始 全 单 和 Windows 专 用 的 特殊 shell werl 的 
快捷 方式 (参见 2.1.1 市 )。 








A.2 在 Mac OS X、Linux 等 类 UNIX 系 统 上 安装 Erlang 


在 类 UNIX 系 统 下 ， 如果 和 需要 最 新 版 本 ,可 以 通过 源码 编译 安装 Erlang; 在 某 些 系统 下 ， 可 以 
借助 软件 包 管 理 硕 (如 Ubuntu 的 synaptic ) 下 载 安 疫 对 应 系统 下 的 官方 Erlang 软 件 包 一 一 但 这 样 安 
装 的 Erlang 可 能 并 非 最 新 版 本 。 在 Mac OS X 下 ， 可 通过 Homebrew 软 件 包 管理 需 
( http://mxcl.github.com/homebrew ) 获取 当前 版 本 的 Erlang。 





A.2.1 编译 源码 


通过 浏览 善 访问 www.erlang.org/download.html 并 获取 最 新 版 本 的 源码 包 。 下 载 完 毕 后 ， 解 开 
tar 包 ，cd 进 入 日 录 ， 人 然后 执行 ./configure 肢 本。 默认 安装 位 置 是 /usr/local/lib/erlang， 如 果 不 打 算 
安装 到 这 个 位 置 下 ， 可 以 加 上 --prefix=.. .参数 。 壁 如 : 

./configure -prefix=/home/jJdoe/libk 

确认 configure 执 行 无 误 后 (如 有 问题 请 参见 下 一 小 节 )， 执 行 

make 
再 执行 

make install 


请 注音， 如 右 安 竣 至 默认 位 置 ， 安 竣 过 程 可 能 需要 root 权 限 。 在 当今 大 多 数 系 统 下 ， 执 行 以 下 
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Sudo make install 
安装 完毕 后 ， 便 可 用 sr1 启 动 Erlang 或 者 用 er1lc 调 用 编译 器 。 如 果 采 用 的 是 非 标准 安装 路 
径 ， 请 确保 相应 路 径 下 的 子 目 录 已 列 于 PATH 环境 变量 内 。 














A.2.2 解决 配置 问题 


编译 Erlang 源 码 时 ， 系 统 中 必须 事先 安装 一 些 库 和 工具 。 其 中 系统 默认 情况 下 可 能 没有 的 党 
见 软件 包 包 括 : 

口 完整 的 GCC 编译 需 环 境 ; 

口 Ncurses 开 发 库 。 

装 好 缺失 的 软件 包 后 ,在 运行 make 之 前 , 请 再 次 运行 configure ( 软件 包 的 具体 名 称 可 能 会 随 
系统 的 不 同 而 不 同 ) 

有 些 库 并 非 必 需 ， 如 有 缺失 ， 配 置 步 又 只 会 给 出 和 警告， 告诉 你 某 些 Erlang 应 用 将 被 禁用 。 如 
林原 本 就 用 不 上 这 些 应 用 , 大 可 耻 接 运行 make; 否则 , 你 还 得 安装 缺失 的 库 并 重新 运行 configure。 
常见 的 几 个 库 包 括 : 

口 OpenSSL 开 发 库 

口 ODBC 开 发 库 

UD Java 

倘 车 禁用 了 某 些 应 用 ,回头 却 又 发 现 用 得 上 它们 ,可 以 再 次 运行 ./configure、make、make install 
来 安 儿 缺失 的 软件 包 。 
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列表 与 引用 透明 性 





你 可 能 会 问 ，Erlang 数 据 类 型 中 的 列表 究竟 有 什么 用 意 呢 (尤其 是 习惯 了 Java、Python 等 语 
言 中 的 数组 、 绥 冲 区 等 概念 之 后 ) ?每 个 元 系 都 要 附 囊 一 个 指 问 下 一 个 元 系 的 指针 ,不 仪 浪费 内 
存 ， 而 且 还 不 能 直接 从 列表 的 右 侧 添加 元 素 ! 哼 ! 

这 些 都 没 错 ， 但 在 Erlang 中 ， 变 量 的 值 不 容 修改 ， 任 何人 的 数据 都 不 会 被 偷偷 摸 摸 的 算 改 。 
这 便 是 引用 透明 性 这 一 术语 育 后 的 含义 。 


B.1 引用 透明 性 的 定义 


引用 透明 性 的 概念 很 规 单 。 简 而 言 之 就 是 : 为 了 跟 踊 菏 个 值 ( 项 式 )， 我 们 赋予 它 一 个 名 子 
(如 X)， 从 此 往 后 ，X 的 引用 可 以 被 传递 给 程序 的 任意 部 分 , 但 X 指 代 的 值 却 恒定 不 变 。 换 诗 之 ， 
变量 所 指 代 的 值 ( 或 值 的 一 部 分 ) 绝 不 会 悄 无 声明 地 变动 。 不 难看 出 ，Erlang 的 单 次 赋值 变量 
是 这 一 原则 的 集中 体现 。 


B.2 引用 透明 性 的 优点 


Java 中 的 字符 串 之 所 以 是 第 量 , 背后 也 是 同样 的 原因 : 假设 你 原本 打算 打印 的 字符 串 是 :“ 神 
父 , 还 要 人 条 吗 ? ” 绪 末 却 因 为 在 打印 之 前 将 字符 第 的 引用 交 给 了 某 个 不 守 规 矩 的 图 效 ， 最 终 打印 
出 一 名 粗暴 无 礼 的 话 ， 那 该 多 乾 粹 呀 1! 
言 归 正 传 ， 之 所 以 Erlang 中 的 数据 都 要 训 循 引用 透明 性 ， 原 因 如 下 。 
口 大 幅 减 少 程序 错误 一 一 对 于 长 达 百 万 行 代码 、 涉 及 数 十 甚至 数 百 程序 员 的 大 型 项 目 来 说 ， 
这 一 点 非 弟 午 要 。 
口 将 单 进程 模式 下 运作 良好 的 代码 切 分 至 多 个 进程 时 ， 无 须 重 写 代码 : 在 将 代码 切 分 至 多 
个 进程 ( 可 能 运行 于 多 台 机 各 上 ) 时 ， 不 必 担 心 磁 到 会 导致 代码 无 法 正常 工作 的 陷阱 。 
口 由 于 不 存在 对 现 有 数据 结构 的 写 操 作 ， 系 统 可 以 对 内 存 管理 和 多 线程 管理 进行 更 具 创 新 
性 的 优化 。 
此 ， 引 用 透明 性 绝 不 仪 仅 是 号 处 象牙 塔 内 的 少数 人 的 理论 退 求 一 一 它 对 程序 的 稳定 性 、 
可 扩展 性 有 看 深 二 的 影响 ; 更 不 用 说 对 代码 的 可 读 性 、 可 调试 性 ， 以 及 开发 速度 所 起 到 的 积极 
作用 了 。 
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B.3 与 列表 的 关系 


回 到 列表 上 来 ， 要 保障 手头 现 有 的 列表 ( 可 能 是 来 利水 数 的 参数 ) 的 引用 透明 性 ， 就 意味 着 
不 能 向 列表 的 末尾 追加 元 系 。 否则 同样 持 有 该 列表 的 引用 的 人 会 发 现 列表 的 末尾 无 中 生 有 地 多 出 
了 一 个 元 素 。 这 在 Erlang 中 是 不 允许 的 。 

然而 从 左 侧 添加 元 素 却 没有 问题 〈 利 用 列表 单元 )， 因 为 原 列 表 不 会 受到 影响 一 一 只 需 创建 
一 个 新 的 列表 单元 ， 并 指 问 原 列 表 的 第 一 个 单元 ， 这 就 好 像 是 在 说 :“ 这 个 列表 不 错 ， 我 要 了 ， 
不 过 表 头 还 得 追加 一 个 新 元 素 。 

因此 , 列表 单元 可 以 优雅 地 解决 引用 透明 系统 中 列表 的 动态 增长 问题 ; 而 且 列 表单 元 的 实现 
方案 也 非常 简单 高 效 。( 几 十 年 来 ) 许多 聪明 绝顶 的 人 士 都 试图 寻找 这 样 一 种 解决 方案 一 一 在 保 
留 引 用 透明 特性 的 同时 , 既 可 以 文 持 在 未 尾 追 加 元 系 又 可 以 保持 较 低 的 内 存 消 耗 , 但 最 终 这 些 方 
采 实 现 起 来 都 过 于 复 淋 ， 在 通用 情况 下 效率 也 不 理想 。 
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FT 加 灵 娠 记 设 计 从 书 


The 
Pragmatic 
"ogrammers 





Seven Languages in Seven Weeks 
A Pragmatic Guide to Learning Programming Languages 


七 周 七 语言 
理解 多 种 编程 范 型 


[ 美 ] Bruce A. Tate 和 著 We ~ 
戴 玮 白明 巨 成 译 i Be 





加 2011 年 Jolt 大 奖 图 书 
加 带 你 轻松 入 门 七 种 先锋 语言 
加 开阔 视野 ， 享 受 更 多 编程 乐趣 


欧 人 民 邮 电 出 版 社 


本 书 荣获 2011 年 Jolt 大 奖 ， 深 度 
挖掘 以 下 七 种 语言 的 精华 : 

售 Ruby 

全 lo 

S Prolog 

Scala 

$ Erlang 

售 Clojure 

售 Haskell 
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“惊艳 ! 不 管 是 对 于 初学 者 还 是 Erlang 高 手 ， 本 书 绝对 都 是 不 容错 过 的 好 书 。 一 一 Amazon.com 书 评 


“多 核 处 理 器 和 并 发 编程 是 将 来 的 重头 戏 ，Erlang 在 下 一 代 编 程 语言 中 可 谓 独 领 风骚 ! ” ”一 一 DZone 书 评 
“Erlang 开 发 者 必 备 两 本 书 ， 一 本 是 Erlang 之 父 Joe Armstrong 的 《Erlang 程 序 设计 》， 另 一 本 就 是 本 书 一 一 
务实 、 高 效 又 不 失 幽 默 风趣 的 好 书 啊 ! ” 一 一 slashdot.org 书 评 





Erlang and OTP in Action 





通过 提高 CPU 时 钟 频 率 来 制造 更 快 的 单 核 芯 片 的 技术 已 经 到 达 了 极限 。 多 核 、 并 发 、 分 布 式 等 概念 和 技术 也 
随 之 走出 象牙 塔 ， 成 为 每 个 一 线 开 发 者 的 必 备 技能 。 由 通信 和 巨头 爱立信 研发 的 Erlang/OTP 大 放 异 彩 ， 二 十 多 年 
来 ， 在 传统 电信 和 领域 高 并 发 、 高 可 靠 、 高 容错 的 严酷 环境 下 ，Erlang 语 言 和 和 OTP 平台 被 锻炼 得 坚 如 磐石 ， 浓 郁 的 
函数 式 特质 更 是 恰到好处 地 弥补 了 传统 命令 式 语言 在 并 发 编程 上 的 固有 缺陷 ， 大 大 降低 了 构筑 并 发 、 容 错 、 分 布 
式 应 用 的 门槛 。 

如 果 将 Erlang 语 言 看 成 才华 横 溢 的 钢琴 家 ， 那 么 OTP 平 台 就 是 一 架 能 让 钢琴 家 把 才能 发 挥 得 淋漓 尽 致 的 钢 
琴 。 本 书 除了 全 面 介绍 Erlang 语 言 和 OTP 平 台 的 基础 知识 外 ， 还 通过 一 系列 实用 案例 引领 你 深入 了 解 OTP 的 高 级 
特性 ， 一 步 步 构建 一 个 大 型 生产 系统 ， 并 加 以 优化 和 完善 。 三 位 作者 在 Erlang 领 域 拥 有 极其 丰富 的 实战 经 验 ， 细 
致 入 微 地 剖析 了 OTP 开 发 与 部 署 的 全 过 程 。 要 想 真 刀 真 枪 地 上 战场 ， 本 书 才 是 你 明智 的 选择 1 


国 首部 OTP 开 发 部 署 实 战 指南 
国 着 眼 于 产品 级 代码 开发 
国 各 级 Erlang 开 发 人 员 必 备 读物 


导 国 MANNING ISBN 978-7-115-28559- 


1 
新 浪 微 博 : @ 图 灵 教 育 ”@ 图 灵 社 区 
反馈 /投稿 /推荐 信箱 : contact@turingbook.com 
热线 : (010)51095186 转 604 . 


二 二 vv 必 计算 机 /程序 设计 ISBN 978-7-115-28559-1 


人 民 邮 电 出 版 社 网 址 : www.ptpress.com.cn 定价 : 79.00 元 
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图 灵 社 区 : www .ituring.com.cn | 
9787115 285591 








最 前 疝 的 T 类 电子 书 发 售 平台 


电子 出 版 的 时 代 已 经 来 临 。 在 许多 出 版 界 同行 还 在 犹 
耶 入 得 的 时 候 ， 图 灵 社 区 已 经 采取 实际 行动 拥抱 这 个 
出 版 业 巨 变 。 作 为 国内 第 一 家 发 售 电 子 图 书 的 IT 类 出 
上 厂商， 图 灵 社 区 目前 为 读者 提供 两 种 DRM-free 的 阅读 
体验 : 在 线 阅 读 和 PDF。 


























相 比 纸 质 书 ， 电 子 书 具 有 许多 明显 的 优势 。 它 不 仅 发 
布 快 ， 更 新 容易 ， 而 且 尽 可 能 采用 了 彩色 图 乒 〈 即 使 
有 的 书 纸 质 版 是 黑白 印刷 的 ) 。 读 少 还 可 以 方便 地 进 
行 搜 索 、 剪 贴 、 复 制 和 打印 。 





最 方便 的 开放 出 版 平台 


图 灵 社 区 癌 读 者 开放 在 线 写 作 功 能 ， 协 助 你 实现 目 出 
版 和 开源 出 版 的 梦想 。 利 用 “合集 功能， 你 就 能 联 
合 二 三 好 友 共 同 创 作 一 部 技术 参考 书 ， 以 免费 或 收费 
的 形式 提供 给 读者 。 (收费 形式 须 经 过 图 灵 社 区 立项 
评审 。) 这 极 大 地 降低 了 出 版 的 门槛 。 只 要 你 有 写作 
的 意愿 ， 图 灵 社 区 就 能 帮助 你 实现 这 个 梦想 。 成 熟 的 
书 稳 ， 有 机 会 入 选 出 版 计划 ， 同 时 出 版 纸 质 书 。 








图 灵 社 区 引进 出 版 的 外 文 图 书 ， 都 将 在 立项 后 马上 在 
社区 公布 。 如 末 你 有 意 翻译 哪 本 图 书 ， 欢 迎 你 来 社区 
申请 。 只 要 你 通过 试 译 的 考验 ， 即 可 签约 成 为 图 灵 的 
译 痢 。 当 然 ， 要 想 成 功 地 完成 一 本 书 的 翻译 工作 ， 是 
需要 有 坚强 的 妆 力 的 。 


欢迎 加 入 


各 灵 社区 


图 灵 社 区 进一步 把 传统 出 版 流程 写 电子 书 出 版 业务 
崇 密 结合 ， 目 前 已 实现 作 译 肴 网 上 交 稿 、 编 辑 网 上 
审 稿 、 按 革 发 布 的 电子 出 版 模式 。 这 种 新 的 出 版 模 
式 ， 我 们 称 之 为 “敏捷 出 版 ， 它 可 以 让 谈 痢 以 较 
快 的 速度 了 解 到 国外 最 新 技术 图 书 的 内 容 ， 弥 补 以 
往 翻 译 版 技术 书 “ 出 版 即 过 时 ”的 缺憾 。 同 时 ， 敏 
捷 出 版 使 得 作 、 译 、 编 、 读 的 交流 更 为 方便 ， 可 以 
提前 消灭 书稿 中 的 销 误 ， 最 大 程度 地 保证 图 书 出 版 


的 质量 。 














最 直接 的 读者 交流 平台 


在 图 灵 社 区 ， 你 可 以 十 分 方便 地 写作 文 草 、 提 交 勘 
误 、 发 表 评 论 ， 以 各 种 方式 写作 译 者 、 编 辑 人 员 和 
其 他 读者 进行 交流 互动 。 提 交 勘 误 还 能 够 医 赠 社区 
银子 。 





你 可 以 积极 参与 社区 经 和 党 开展 的 访谈 、 审 恋 、 评 选 
等 多 种 活动 ， 最 取 积 分 和 银子 ， 积 累 个 人 声望 。 


ituring.com.cn 
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